[發明專利]混合模型語音識別有效
| 申請號: | 201810238968.6 | 申請日: | 2013-06-26 |
| 公開(公告)號: | CN108648750B | 公開(公告)日: | 2023-02-28 |
| 發明(設計)人: | A·H·格倫斯坦;P·阿列克西克 | 申請(專利權)人: | 谷歌有限責任公司 |
| 主分類號: | G10L15/18 | 分類號: | G10L15/18;G10L15/14;G10L15/19;G10L15/26;G10L15/32;G10L15/30 |
| 代理公司: | 中原信達知識產權代理有限責任公司 11219 | 代理人: | 李佳;穆德駿 |
| 地址: | 美國加利*** | 國省代碼: | 暫無信息 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 混合 模型 語音 識別 | ||
1.一種計算機實現的方法,包括:
通過移動計算設備或數字助理設備接收與用戶的話語相對應的音頻數據;
通過在所述移動計算設備或所述數字助理設備上實現的自動語音識別器,生成與所述移動計算設備或所述數字助理設備能夠執行的話音動作相關聯的個性化轉錄,所述自動語音識別器具有詞匯,所述詞匯包括未被包含在基于云的自動語音識別器的詞匯中的一個或多個術語,所述個性化轉錄包括未被包含在所述基于云的自動語音識別器的所述詞匯中的所述一個或多個術語中的一個或多個;
通過所述移動計算設備或所述數字助理設備將所述音頻數據傳輸到所述基于云的自動語音識別器,所述基于云的自動語音識別器被配置來:
生成所述話語的錯誤轉錄;以及
將所述話語的所述錯誤轉錄傳輸到所述移動計算設備或所述數字助理設備;
通過所述移動計算設備或所述數字助理設備確定由所述基于云的自動語音識別器生成的所述話語的所述錯誤轉錄是否包括與所述移動計算設備或所述數字助理設備能夠執行的所述話音動作相關聯的術語;以及
當由所述基于云的自動語音識別器生成的所述話語的所述錯誤轉錄包括與所述移動計算設備或所述數字助理設備能夠執行的所述話音動作相關聯的術語時,提供搜索結果頁面以用于由所述移動計算設備或所述數字助理設備輸出,所述搜索結果頁面包括(i)用于發起與所述個性化轉錄相關聯的所述話音動作的控件,以及(ii)一個或多個搜索結果,所述一個或多個搜索結果是基于由所述基于云的自動語音識別器生成的所述話語的所述錯誤轉錄而生成的。
2.根據權利要求1所述的方法,其中,未被包含在所述基于云的自動語音識別器的所述詞匯中的所述一個或多個術語包括未同步到云的聯系人姓名。
3.根據權利要求1所述的方法,其中,未被包含在所述基于云的自動語音識別器的所述詞匯中的所述一個或多個術語包括安裝在所述移動計算設備上的應用的名稱。
4.根據權利要求1所述的方法,進一步包括:通過與所述基于云的自動語音識別器相關聯的搜索引擎,使用所述話語的錯誤轉錄的一個或多個術語作為查詢術語來生成所述一個或多個搜索結果。
5.根據權利要求1所述的方法,其中,所述基于云的自動語音識別器的所述詞匯多于在所述移動計算設備上實現的所述自動語音識別器所使用的詞匯。
6.根據權利要求1所述的方法,其中,在確定與所述個性化轉錄相關聯的語音識別置信度評分不滿足最小置信度閾值之后,提供用于發起與所述個性化轉錄相關聯的所述話音動作的所述控件以用于輸出。
7.根據權利要求1所述的方法,其中,所述用戶的所述話語是人的姓名的話語;
其中,所述個性化轉錄是所述人的所述姓名;并且
其中,所述錯誤轉錄不是所述人的所述姓名。
8.根據權利要求1所述的方法,其中,所述一個或多個搜索結果包括指定使用所述話語的所述錯誤轉錄來識別的互聯網資源的搜索結果。
9.根據權利要求1所述的方法,其中,所述個性化轉錄是由在所述移動計算設備或所述數字助理設備上實現的所述自動語音識別器使用第一語言模型來生成的,所述第一語言模型包括所述用戶的用戶特定信息;以及
其中,所述錯誤轉錄是由所述基于云的自動語音識別器使用第二語言模型來生成的,所述第二語言模型不包括所述用戶的用戶特定信息。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于谷歌有限責任公司,未經谷歌有限責任公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810238968.6/1.html,轉載請聲明來源鉆瓜專利網。





