[發明專利]語音對話系統、語音對話裝置、用戶終端以及語音對話方法在審
| 申請號: | 201780065619.2 | 申請日: | 2017-11-06 |
| 公開(公告)號: | CN109891498A | 公開(公告)日: | 2019-06-14 |
| 發明(設計)人: | 廣江厚夫;岡本拓磨;木俵豐 | 申請(專利權)人: | 國立研究開發法人情報通信研究機構 |
| 主分類號: | G10L15/00 | 分類號: | G10L15/00;G10L15/22;G10L15/30 |
| 代理公司: | 北京鴻元知識產權代理有限公司 11327 | 代理人: | 溫劍;陳英俊 |
| 地址: | 日本*** | 國省代碼: | 日本;JP |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 語音對話 語音對話系統 用戶終端 過去的 對話 配對服務器 存儲介質 對話信息 存儲 認知 發送 語言 | ||
以往,在用戶與語音對話裝置之間的一系列的對話進行了一定程度之后,該用戶或者其他用戶無法對過去的對話的狀況進行確認等。本發明的跨語言的語音對話系統在配對服務器接收到來自用戶終端的指示的情況下,存儲在存儲介質中的對話信息被發送至用戶終端,根據該語音對話系統,在用戶與語音對話裝置之間的一系列的對話進行了一定程度之后,該用戶或者其他用戶能夠確認或者認知過去的對話的狀況。
技術領域
本發明涉及在混有多個語言的環境下使用的跨語言的語音對話裝置等。
背景技術
語音對話系統在用戶相對于系統用語音講話提問等時,系統相對于該講話進行如以下(1)至(4)的處理,將得到的響應用語音或者文字等輸出。
(1)語音識別:將語音講話轉換成對應的文本。
(2)語言理解:將語音識別結果分類成與意思相應的概念,并且進行在響應生成中使用的關鍵詞的提取等。
(3)對話控制:根據概念以及關鍵詞生成與其相應的響應的文本。還根據需要進行通過進行對話履歷的反映和對話情景的遷移等,來對相同的語音講話生成不同的響應等處理。
(4)語音合成:將響應的文本轉換成相應的語音波形。
另外,在機場或著名景點等、說各種語言的人聚集的場所,進行設施向導或觀光向導的語音對話系統優選與多個語言相對應。將僅與單個語言相對應的系統稱為單語言(語音)對話系統,將與多個語言相對應的系統稱為多語言(語音)對話系統。語言的切換除了用戶的手動操作之外,在技術上也能夠實現自動識別用戶講話的語言并使用與該語言相匹配的語音識別、語言理解、響應生成、語音合成。
進一步,也考慮在如上所述存在說各種語言的人們的環境下,分別說不同語言的多個人同時使用一臺系統的場景。在這種場景下,在某用戶用一個語言進行了與系統的對話之后,說其他語言的用戶開始與系統的對話的情況下,如果接管此前的對話履歷進行響應生成,則在以下各方面有益。
(1)在想要對之前的用戶進行的提問追加提問的情況下,由于無需在語言切換時重新輸入之前的提問,因此與沒有語言間的對話的接管的情況相比,能夠在相同時間供多個用戶使用。
(2)由于說不同語言的用戶之間也能夠協作使用一臺系統,因此能夠作為交流促進工具。
將具有如上所述的特點的語音對話系統稱為跨語言語音對話系統。
而且,關于跨語言對話系統,在以下的非專利文獻1、非專利文獻2的以往技術中已被公開。該跨語言對話系統為使用加權有限狀態轉換器(WFST)的框架的語音對話系統。
在上述語音對話系統中,具備用全部的對應語言顯示用戶的講話以及系統的響應的機構。將它稱為“實況轉播顯示器”。實況轉播顯示器的例子如圖27所示。在圖27中,由作為語言對話系統的一臺機器人(R)與說英語、日語、中文的三個用戶(EU、JU、CU)進行對話。在此,說英語的用戶(EU)對機器人(R)用英語講話,機器人(R)也用英語對其響應,說日語的用戶(JU)以及說中文的用戶(CU)也分別用自己的語言講話,機器人(R)用與之相同的語言響應。另一方面,在實況轉播顯示器的顯示中,用戶的講話除了用戶講話的語言之外,還用其他對應語言顯示。另外,機器人(R)的響應也同樣地,除了與用戶講話相同的語言之外,還用其他對應語言顯示。
通過這種實況轉播顯示器,參與跨語言對話的、彼此說不同語言的用戶能夠容易地理解其他用戶的講話以及系統的響應。另外,在該對話系統的周圍觀看對話的人們(以下適當地稱為“觀眾”)也能夠理解進行著什么樣的對話,因此便于從中途開始參與對話。
在先技術文獻
非專利文獻
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于國立研究開發法人情報通信研究機構,未經國立研究開發法人情報通信研究機構許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201780065619.2/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:動態的文本到語音供應
- 下一篇:語音識別裝置及語音識別方法





