[發明專利]信息處理裝置和信息處理方法在審
| 申請號: | 201780048909.6 | 申請日: | 2017-07-26 |
| 公開(公告)號: | CN109643541A | 公開(公告)日: | 2019-04-16 |
| 發明(設計)人: | 河野真一;巖瀨廣;齋藤真里 | 申請(專利權)人: | 索尼公司 |
| 主分類號: | G10L13/10 | 分類號: | G10L13/10;G10L13/02 |
| 代理公司: | 北京集佳知識產權代理有限公司 11227 | 代理人: | 王萍;唐明英 |
| 地址: | 日本*** | 國省代碼: | 日本;JP |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 語音 信息處理裝置 合成 情境數據 輸出形式 文本轉換 信息處理 語音控制 語音合成單元 輸出 控制合成 輸出合成 輸出控制 數據生成 通信單元 語音輸出 客戶端 服務器 傳送 應用 | ||
1.一種信息處理裝置,包括:
語音輸出控制部,其被配置成基于通過將文本轉換成語音而獲得的合成語音被輸出時的情境來控制所述合成語音的輸出形式。
2.根據權利要求1所述的信息處理裝置,其中,在所述情境滿足預定條件的情況下,所述語音輸出控制部改變所述合成語音的輸出形式。
3.根據權利要求2所述的信息處理裝置,其中,所述合成語音的輸出形式的改變包括改變以下中至少之一:所述合成語音的特性、針對所述合成語音的效果、所述合成語音的背景中的BGM(背景音樂)、所述合成語音中輸出的文本或者用于輸出所述合成語音的裝置的操作。
4.根據權利要求3所述的信息處理裝置,
其中,所述合成語音的特性包括以下中至少之一:速度、音調、音量或語調,并且
針對所述合成語音的效果包括以下中至少之一:重復所述文本中的特定詞句或將停頓插入到所述合成語音中。
5.根據權利要求2所述的信息處理裝置,其中,在檢測到用戶的注意力未被引導至所述合成語音的狀態時,所述語音輸出控制部改變所述合成語音的輸出形式。
6.根據權利要求2所述的信息處理裝置,其中,在所述合成語音的輸出形式改變之后檢測到用戶的注意力被引導至所述合成語音的狀態時,所述語音輸出控制部將所述合成語音的輸出形式返回至初始形式。
7.根據權利要求2所述的信息處理裝置,其中,在所述合成語音的特性的變化量在預定范圍內的狀態持續至少預定時間段的情況下,所述語音輸出控制部改變所述合成語音的輸出形式。
8.根據權利要求2所述的信息處理裝置,其中,所述語音輸出控制部基于所述情境來選擇改變所述合成語音的輸出形式的方法。
9.根據權利要求2所述的信息處理裝置,還包括:
學習部,其被配置成學習用戶對改變所述合成語音的輸出形式的方法的反應,
其中,所述語音輸出控制部基于對所述用戶的反應的學習結果來選擇改變所述合成語音的輸出形式的方法。
10.根據權利要求1所述的信息處理裝置,其中,所述語音輸出控制部還基于所述文本的特性控制所述合成語音的輸出形式。
11.根據權利要求10所述的信息處理裝置,其中,所述語音輸出控制部在所述文本的特征量等于或大于第一閾值的情況下或者在所述文本的特征量小于第二閾值的情況下改變所述合成語音的輸出形式。
12.根據權利要求1所述的信息處理裝置,其中,所述語音輸出控制部向其他信息處理裝置提供用于生成所述合成語音的語音控制數據,由此控制來自所述其他信息處理裝置的所述合成語音的輸出形式。
13.根據權利要求12所述的信息處理裝置,其中,所述語音輸出控制部基于從所述其他信息處理裝置獲取的與所述情境有關的情境數據來生成所述語音控制數據。
14.根據權利要求13所述的信息處理裝置,其中,所述情境數據包括以下中至少之一:基于捕獲的用戶周圍的圖像的數據、基于來自所述用戶周圍的語音的數據或基于與所述用戶有關的生物信息的數據。
15.根據權利要求13所述的信息處理裝置,還包括:
情境分析部,其被配置成基于所述情境數據分析所述情境。
16.根據權利要求1所述的信息處理裝置,其中,所述情境包括以下中至少之一:用戶的狀況、所述用戶的特性、輸出所述合成語音的環境或所述合成語音的特性。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于索尼公司,未經索尼公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201780048909.6/1.html,轉載請聲明來源鉆瓜專利網。





