[發明專利]對話控制裝置和方法在審

申請號：	201780049114.7	申請日：	2017-08-03
公開（公告）號：	CN109564757A	公開（公告）日：	2019-04-02
發明（設計）人：	巖瀨廣;齋藤真里;河野真一	申請（專利權）人：	索尼公司
主分類號：	G10L13/08	分類號：	G10L13/08;G10L13/00;G10L13/10;G10L15/22
代理公司：	北京集佳知識產權代理有限公司 11227	代理人：	杜誠;劉敏
地址：	日本***	國省代碼：	日本;JP
權利要求書：	查看更多	說明書：	查看更多
摘要：
搜索關鍵詞：	對話控制裝置話語文本進度控制行為請求對話控制對話系統檢測結果位置處對話誘導話語應用
鉆瓜網技術展會專利詞庫專利權人專利榜在售專利公布日期熱門專利

【說明書】：

本發明涉及可以執行更加適當的對話控制的對話控制裝置和方法。該對話控制裝置設置有對話進度控制單元，該對話進度控制單元基于由理解行為請求位置劃分的話語文本，在一個或多個理解行為請求位置處誘導用戶的理解行為，并且基于話語文本和對理解行為的檢測結果來控制隨后的話語。本發明可以被應用于聲音對話系統。

技術領域

本技術涉及交互控制裝置和方法，并且特別地涉及使得能夠執行更加適當的交互控制的交互控制裝置和方法。

背景技術

傳統上，已知用于控制與用戶的語音交互的技術。

上述技術的示例包括向用戶請求語音話語、基于用戶說出的關鍵詞來確定用戶的理解程度、以及根據確定結果推進交互的技術(例如，參見專利文獻1)。

此外，例如，還提出了在與用戶的交互中檢測用戶的快速響應行為或者向用戶請求快速響應的技術(例如，參見專利文獻2)。

引用列表

專利文獻

專利文獻1：日本專利申請公開第2005-234331號

專利文獻2：日本專利申請公開第H9-218770號

發明內容

本發明要解決的問題

然而，在上述技術中，難以適當地控制與用戶的語音交互。

例如，在基于關鍵字確定用戶的理解程度的技術中，根據用戶的理解程度輸出提示用戶輸入語音的消息。然而，在系統通過語音來呈現要發送給用戶的大量信息(例如要發送給用戶的長的項目列表，或指示要發送的內容的長句子)的情況下，無法以適當的粒度(即，在適當的定時處)測量用戶的理解程度。

文本到語音(Text To Speech，TTS)中的合成語音具有恒定的速度和語音抑揚。在信息量很大、并且要通過語音說出的句子很長的情況下，例如，有可能執行不適合用戶情況的交互控制，以致于即使當用戶理解話語的內容并且集中精力聆聽話語時，也以慢速說出話語或頻繁地提示用戶輸入語音。在這種情況下，用戶難以理解話語的內容，并且用戶也難以記住話語的內容。

此外，在上述技術中，在語音交互期間(即在話語語音的句子中間)，沒有誘導對用戶而言負擔小的、諸如快速響應或點頭的理解行為。

因此，不能例如通過以下方式以適當的粒度向用戶請求對用戶而言負擔小的理解行為：根據用戶的專注程度或理解程度來控制在比句子短的句段(短語)之間的劃分處或在語義劃分處請求理解行為的頻率。

鑒于上述情況創建了本技術，并且本技術使得能夠執行更加適當的交互控制。

問題的解決方案

本技術的一個方面的交互控制裝置包括交互進度控制器，該交互進度控制器基于已經在一個或多個理解行為請求位置處劃分的話語文本，使得在所述一個或多個理解行為請求位置處話語被說出，該話語誘導用戶執行理解行為，并且交互進度控制器基于檢測理解行為的結果和話語文本來控制下一話語。

在由用戶執行的理解行為是肯定行為的情況下，可以使交互進度控制器使得話語文本中的尚未說出的下一詞語被說出。

在由用戶執行的理解行為是否定行為的情況下，可以使交互進度控制器使得最近說出的話語被再次說出。

可以使交互進度控制器控制基于話語文本的話語，使得隨著由用戶執行的肯定理解行為的響應時間減少，誘導理解行為的次數也減少。

可以使交互進度控制器控制基于話語文本的話語，使得隨著由用戶執行的肯定理解行為的響應時間減少，話語速度提高。

可以使交互進度控制器控制基于話語文本的話語，使得隨著由用戶執行的肯定理解行為的響應時間減少，話語的聲調變得更高。

下載完整專利技術內容需要扣除積分，VIP會員可以免費下載。

免登錄下載普通用戶下載升級VIP會員，免費下載