[發明專利]在自然語言處理中使用先前對話行為進行的語境解釋有效
| 申請號: | 201580027417.X | 申請日: | 2015-05-20 |
| 公開(公告)號: | CN106796787B | 公開(公告)日: | 2020-12-22 |
| 發明(設計)人: | 朱塞佩·迪法布里奇奧;希希爾·斯里德哈·巴拉蒂;Y·史;蘭伯特·馬賽厄斯 | 申請(專利權)人: | 亞馬遜技術有限公司 |
| 主分類號: | G10L15/18 | 分類號: | G10L15/18;G10L15/22;G06F16/332;G10L15/00;G06F40/35;G10L15/30 |
| 代理公司: | 北京天昊聯合知識產權代理有限公司 11112 | 代理人: | 顧麗波;井杰 |
| 地址: | 美國華*** | 國省代碼: | 暫無信息 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 自然語言 處理 使用 先前 對話 行為 進行 語境 解釋 | ||
公開了用于在多輪對話交互中處理并且解釋自然語言(諸如用戶話語的解釋)的特征。可以維持語境信息,所述語境信息有關用戶話語的解釋和對所述用戶話語的系統響應。可以使用所述語境信息來解釋后續用戶話語,而非在沒有語境的情況下解釋后續用戶話語。在一些情況下,可以使用基于規則的框架將后續用戶話語的解釋與先前用戶話語的解釋合并。可定義規則來確定可合并哪個解釋以及在什么條件下可合并它們。
背景
語音處理系統包括用于從用戶接收口頭輸入并且確定用戶是什么意思的各種模塊和部件。在一些實現方式中,語音處理系統包括接收用戶話語音頻輸入并且生成一個或多個可能的話語錄音的自動語音識別(ASR)模塊。ASR模塊通常使用聲學模型和語言模型。聲學模型用來生成假設,針對所述假設,詞或子詞單元(例如,音素)基于話語的聲學特征來對應于話語。語言模型用來基于說出話語的語言的詞匯特征來確定使用聲學模型生成的哪個假設是最可能的話語錄音。
語音處理系統還可包括自然語言理解(NLU)模塊,所述自然語言理解模塊接收文本輸入,諸如用戶話語的錄音,并且使用能以諸如計算機應用程序應用的方式來確定文本的含義。例如,NLU模塊可用來使用統計語言模型來確定由ASR模塊生成的文本的含義。NLU模塊可以隨后根據ASR輸出來確定用戶意圖并且將所述意圖提供到某個下游處理,所述某個下游處理響應于確定的用戶意圖來執行某項任務(例如,生成啟動電話呼叫、啟動所請求音樂的回放、提供所請求信息等命令)。
一些語音處理系統配置成與用戶進行多輪對話交互。例如,用戶可能希望啟動某個處理或任務,但是可能未提供全部的必需信息。在這種情況下,語音處理系統可以提示用戶缺失的必需信息。作為另一個實例,用戶可能希望從系統接收信息。語音處理系統可以提供所請求的信息并且允許用戶基于所提供的信息啟動后續的處理。
附圖簡述
現在將參考以下附圖來描述各個發明特征的實施方案。在全部附圖中,參考數字可被重復使用來指示所參考元件之間的對應關系。附圖被提供來示出本文所述的示例性實施方案,并且并不意圖限制本公開的范圍。
圖1是在使用先前輪的語境信息進行的多輪對話話語處理期間語音處理系統的各模塊之間的說明性數據流的框圖。
圖2是在使用語境解釋器進行的話語處理期間客戶端裝置與語音處理系統之間的說明性數據流的框圖。
圖3是在使用語境解釋器進行的話語處理期間客戶端裝置與語音處理系統之間的說明性數據流的框圖。
圖4是使用語境解釋器來處理話語的說明性處理的流程圖。
圖5是確定當前話語解釋是否可以與先前話語解釋合并的說明性處理的流程圖。
詳述
本公開涉及增強語音處理系統自然地參與—并且準確地管理—與用戶進行的多輪對話交互(例如,包括多個用戶話語和/或多個系統響應以完成某項任務的口頭對話會期)的能力。大體來描述,多輪對話交互的語音處理結果的準確度至少部分地取決于:能夠確定用戶話語在先前的用戶啟動和/或系統啟動的對話交互中所傳達的意圖或信息。當語音處理系統未能維持多輪對話交互的適當語境時,或當用戶偏題、說出有關未預期意圖的話語、說出句子片段等等時,語音處理系統可能無法準確地響應用戶的話語。一些系統使用嚴格的語法或高度結構化對話,其僅允許特定響應(例如,推導特定信息的提示僅可用推導出的信息來響應—所有的其他響應都被拒絕)。然而,此類系統不允許很多用戶和應用程序開發商所期望的自然口頭交互。其他系統使用內部提示問題或關于未來用戶話語的預期主題(例如,預期意圖或與意圖相關的信息)的其他信息。可在偏向預期主題的情況下處理下一個用戶話語,同時仍然允許接受并且恰當地處理有關未預期主題的話語。然而,此類系統可能無法恰當地處理從正在進行的多輪對話交互偏題和返回到所述多輪對話交互,或此類系統可能過于頻繁或過快地丟失多輪對話交互的當前語境。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于亞馬遜技術有限公司,未經亞馬遜技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201580027417.X/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:有源型噪聲降低裝置
- 下一篇:編碼方法、裝置、以及記錄介質





