[發明專利]神經語音到意思在審
| 申請號: | 202011401199.0 | 申請日: | 2020-12-03 |
| 公開(公告)號: | CN113012686A | 公開(公告)日: | 2021-06-22 |
| 發明(設計)人: | 闞德順;韋美曦;普仲朗 | 申請(專利權)人: | 聲音獵手公司 |
| 主分類號: | G10L15/06 | 分類號: | G10L15/06;G10L15/22;G10L15/26 |
| 代理公司: | 北京東方億思知識產權代理有限責任公司 11258 | 代理人: | 姜飛 |
| 地址: | 美國加利*** | 國省代碼: | 暫無信息 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 神經 語音 意思 | ||
1.一種用于識別語音音頻中的意圖的機器,該機器包括:
變量識別器,該變量識別器處理語音音頻特征,計算所述語音音頻具有多個枚舉變量值中的任何一者的概率,并且輸出具有最高概率的變量值;以及
意圖識別器,該意圖識別器處理語音音頻特征,計算所述語音音頻具有所述意圖的概率,并響應于所述語音音頻具有所述意圖的概率高于意圖閾值而產生對虛擬助手動作的請求。
2.根據權利要求1所述的機器,其中:
所述變量識別器指示所述語音音頻具有枚舉變量值的概率;并且
所述意圖識別器根據所述語音音頻具有枚舉變量值的概率來調節其對動作的請求的輸出。
3.根據權利要求2所述的機器,其中,所述調節基于關于所述語音音頻具有枚舉變量值的概率的經延遲的指示。
4.根據權利要求1所述的機器,其中,所述意圖識別器基于哪個變量值具有所述最高概率來調節其對動作的請求的輸出。
5.根據權利要求4所述的機器,其中,所述調節基于關于哪個變量值具有所述最高概率的經延遲的指示。
6.根據權利要求1所述的機器,其中,所述變量識別器和所述意圖識別器中的一個識別器產生得分,并且另一個識別器響應于所述得分高于得分閾值而被調用。
7.根據權利要求1所述的機器,還包括領域識別器,該領域識別器處理語音音頻特征并計算所述語音音頻涉及特定領域的概率,其中所述意圖識別器與所述領域相關聯,并且響應于所述語音音頻涉及特定領域的概率高于領域閾值而被調用。
8.根據權利要求1所述的機器,其中,沒有計算人類可讀的語音轉錄。
9.根據權利要求1所述的機器,還包括具有訪問web API能力的網絡客戶端,其中,響應于所述意圖識別器產生對虛擬助手動作的請求,所述網絡客戶端執行對所述web API的請求,所述請求以所述變量識別器輸出的所述變量值作為自變量。
10.如權利要求9所述的機器,還包括語音合成引擎,其中,響應于從所述web API接收到響應,所述語音合成引擎合成包含來自所述web API響應的信息的語音音頻,并為所述虛擬助手的用戶輸出合成的語音音頻。
11.一種通過計算機系統從語音音頻中識別意圖的方法,該方法包括:
獲得語音音頻;
處理所述語音音頻的特征以計算所述語音音頻具有多個枚舉變量值中的任何一者的概率;
輸出具有最高概率的變量值;
處理所述語音音頻的特征以計算所述語音音頻具有所述意圖的概率;并且
響應于所述語音音頻具有所述意圖的概率高于意圖閾值,而輸出對虛擬助手動作的請求。
12.根據權利要求11所述的方法,其中,輸出所述請求是基于具有所述最高概率的所述變量值的概率來調節的。
13.根據權利要求12所述的方法,其中,所述概率被延遲。
14.根據權利要求11所述的方法,其中,輸出所述請求是基于哪個變量值具有所述最高概率來調節的。
15.根據權利要求14所述的方法,其中,對所述變量值的指示被延遲。
16.根據權利要求11所述的方法,其中,概率計算中的一者響應于另一概率計算具有高于閾值的結果而被執行。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于聲音獵手公司,未經聲音獵手公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011401199.0/1.html,轉載請聲明來源鉆瓜專利網。





