[發明專利]對話控制裝置和方法在審
| 申請號: | 201780049114.7 | 申請日: | 2017-08-03 |
| 公開(公告)號: | CN109564757A | 公開(公告)日: | 2019-04-02 |
| 發明(設計)人: | 巖瀨廣;齋藤真里;河野真一 | 申請(專利權)人: | 索尼公司 |
| 主分類號: | G10L13/08 | 分類號: | G10L13/08;G10L13/00;G10L13/10;G10L15/22 |
| 代理公司: | 北京集佳知識產權代理有限公司 11227 | 代理人: | 杜誠;劉敏 |
| 地址: | 日本*** | 國省代碼: | 日本;JP |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 對話控制裝置 話語文本 進度控制 行為請求 對話控制 對話系統 檢測結果 位置處 對話 誘導 話語 應用 | ||
本發明涉及可以執行更加適當的對話控制的對話控制裝置和方法。該對話控制裝置設置有對話進度控制單元,該對話進度控制單元基于由理解行為請求位置劃分的話語文本,在一個或多個理解行為請求位置處誘導用戶的理解行為,并且基于話語文本和對理解行為的檢測結果來控制隨后的話語。本發明可以被應用于聲音對話系統。
技術領域
本技術涉及交互控制裝置和方法,并且特別地涉及使得能夠執行更加適當的交互控制的交互控制裝置和方法。
背景技術
傳統上,已知用于控制與用戶的語音交互的技術。
上述技術的示例包括向用戶請求語音話語、基于用戶說出的關鍵詞來確定用戶的理解程度、以及根據確定結果推進交互的技術(例如,參見專利文獻1)。
此外,例如,還提出了在與用戶的交互中檢測用戶的快速響應行為或者向用戶請求快速響應的技術(例如,參見專利文獻2)。
引用列表
專利文獻
專利文獻1:日本專利申請公開第2005-234331號
專利文獻2:日本專利申請公開第H9-218770號
發明內容
本發明要解決的問題
然而,在上述技術中,難以適當地控制與用戶的語音交互。
例如,在基于關鍵字確定用戶的理解程度的技術中,根據用戶的理解程度輸出提示用戶輸入語音的消息。然而,在系統通過語音來呈現要發送給用戶的大量信息(例如要發送給用戶的長的項目列表,或指示要發送的內容的長句子)的情況下,無法以適當的粒度(即,在適當的定時處)測量用戶的理解程度。
文本到語音(Text To Speech,TTS)中的合成語音具有恒定的速度和語音抑揚。在信息量很大、并且要通過語音說出的句子很長的情況下,例如,有可能執行不適合用戶情況的交互控制,以致于即使當用戶理解話語的內容并且集中精力聆聽話語時,也以慢速說出話語或頻繁地提示用戶輸入語音。在這種情況下,用戶難以理解話語的內容,并且用戶也難以記住話語的內容。
此外,在上述技術中,在語音交互期間(即在話語語音的句子中間),沒有誘導對用戶而言負擔小的、諸如快速響應或點頭的理解行為。
因此,不能例如通過以下方式以適當的粒度向用戶請求對用戶而言負擔小的理解行為:根據用戶的專注程度或理解程度來控制在比句子短的句段(短語)之間的劃分處或在語義劃分處請求理解行為的頻率。
鑒于上述情況創建了本技術,并且本技術使得能夠執行更加適當的交互控制。
問題的解決方案
本技術的一個方面的交互控制裝置包括交互進度控制器,該交互進度控制器基于已經在一個或多個理解行為請求位置處劃分的話語文本,使得在所述一個或多個理解行為請求位置處話語被說出,該話語誘導用戶執行理解行為,并且交互進度控制器基于檢測理解行為的結果和話語文本來控制下一話語。
在由用戶執行的理解行為是肯定行為的情況下,可以使交互進度控制器使得話語文本中的尚未說出的下一詞語被說出。
在由用戶執行的理解行為是否定行為的情況下,可以使交互進度控制器使得最近說出的話語被再次說出。
可以使交互進度控制器控制基于話語文本的話語,使得隨著由用戶執行的肯定理解行為的響應時間減少,誘導理解行為的次數也減少。
可以使交互進度控制器控制基于話語文本的話語,使得隨著由用戶執行的肯定理解行為的響應時間減少,話語速度提高。
可以使交互進度控制器控制基于話語文本的話語,使得隨著由用戶執行的肯定理解行為的響應時間減少,話語的聲調變得更高。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于索尼公司,未經索尼公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201780049114.7/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種智能鋼琴系統
- 下一篇:電子設備及其語音識別方法





