[發明專利]在調用短語檢測中選擇性地適配和利用噪聲降低技術在審
| 申請號: | 201980014370.1 | 申請日: | 2019-01-14 |
| 公開(公告)號: | CN111742362A | 公開(公告)日: | 2020-10-02 |
| 發明(設計)人: | 克里斯托弗·休斯;黃譯騰;圖拉伊·扎基扎德·沙別斯塔雷;泰勒·阿普勒鮑姆 | 申請(專利權)人: | 谷歌有限責任公司 |
| 主分類號: | G10L15/20 | 分類號: | G10L15/20;G10L21/0208;G10L15/08;G10L21/0216 |
| 代理公司: | 中原信達知識產權代理有限責任公司 11219 | 代理人: | 周亞榮;鄧聰惠 |
| 地址: | 美國加利*** | 國省代碼: | 暫無信息 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 調用 短語 檢測 選擇性 利用 噪聲 降低 技術 | ||
描述了用于在檢測音頻數據幀流的一個或多個特征時選擇性地適配和/或選擇性地利用噪聲降低技術的技術。例如,各種技術涉及在檢測音頻數據幀流中的調用短語、檢測音頻數據幀流中的話音特性(例如,用于說話者識別)等時選擇性地適配和/或利用噪聲降低技術。利用描述的技術能夠在各種情形下諸如在具有強背景噪聲的環境中得到對音頻數據幀流的特征的更魯棒和/或更準確的檢測。在各種實現方式中,結合自動化助理實現描述的技術,并且利用本文描述的技術檢測到的特征來適配自動化助理的功能性。
背景技術
人類可以用在本文中稱為“自動化助理”(也稱為“數字代理”、“聊天機器人”、“交互式個人助理”、“智能個人助理”、“助理應用”、“談話代理”等)的交互式軟件應用來參與人機對話。例如,人類(當他們與自動化助理交互時可以被稱為“用戶”)可以使用口語自然語言輸入(即,發言)和/或通過提供文本(例如,打字)自然語言輸入來向自動化助理提供命令和/或請求,該口語自然語言輸入可以在一些情況下被轉換成文本,然后進行處理。自動化助理通過提供響應性用戶接口輸出來對請求做出響應,該響應性用戶接口輸出能夠包括可聽和/或可視用戶接口輸出。
如上所述,許多自動化助理被配置成經由口語發言與之交互。為了保護用戶隱私和/或保存資源,用戶必須常常在自動化助理將充分地對口語發言進行處理之前顯式地調用自動化助理。對自動化助理的顯式調用通常響應于在客戶端設備處接收到某個用戶接口輸入而發生。客戶端設備包括助理接口,該助理接口向客戶端設備的用戶提供用于與自動化助理交互的接口(例如,接收來自用戶的口語和/或打字輸入,并且提供可聽和/或圖形響應),而且與實現自動化助理的一個或多個附加組件(例如,對用戶輸入進行處理并且生成適當響應的遠程服務器設備)接口。
能夠經由客戶端設備調用自動化助理的一些用戶接口輸入包括客戶端設備處用于調用自動化助理的硬件和/或虛擬按鈕(例如,對硬件按鈕的輕敲、對由客戶端設備顯示的圖形接口元素的選擇)。能夠附加地或替換地響應于一個或多個口語調用短語而調用許多自動化助理,這些口語調用短語也被稱為“熱詞/短語”或“觸發詞/短語”。例如,能夠說出諸如“Hey Assistant(嘿助理)”、“OK Assistant(好的助理)”和/或“Assistant(助理)”的語音調用短語來調用自動化助理。
常常,包括助理接口的客戶端設備包括一個或多個在本地存儲的模型,客戶端設備利用這些模型來監視口語調用短語的發生。這樣的客戶端設備能夠利用在本地存儲的模型來在本地對接收到的音頻數據進行處理,并且丟棄不包括語音調用短語的任何音頻數據。然而,當對接收到的音頻數據的本地處理指示口語調用短語的發生時,客戶端設備然后將使該音頻數據和/或接著的音頻數據由自動化助理進一步處理。例如,如果口語調用短語是“Hey,Assistant(嘿,助理)”且用戶說出“Hey,Assistant,what time is it(嘿,助理,幾點了)”,則與“what time is it(幾點了)”相對應的音頻數據能夠由自動化助理基于對“Hey,Assistant(嘿,助理)”進行的檢測來處理,并且用于提供當前時間的自動化助理響應。另一方面,如果用戶簡單地說出“what time is it(幾點了)”(而沒有首先說出調用短語),則作為“what time is it(幾點了)”之前沒有調用短語的結果,不提供來自自動化助理的響應。
盡管存在用于監視口語調用短語的發生的模型,但是許多此類模型遭受一個或多個缺點。例如,一些模型在具有強背景噪聲(例如,來自電視、來自播放音樂、來自其它談話的噪聲)的環境中表現很差。例如,一些模型在存在背景噪聲的情況下可能缺少期望的魯棒性和/或準確性。這可能導致無法檢測到實際的口語調用短語并且/或者可能導致對調用短語的錯誤檢測。
發明內容
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于谷歌有限責任公司,未經谷歌有限責任公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201980014370.1/2.html,轉載請聲明來源鉆瓜專利網。





