[發明專利]自動地確定用于經由自動化助理接口接收的口頭話語的語音辨識的語言有效
| 申請號: | 201880039579.9 | 申請日: | 2018-04-16 |
| 公開(公告)號: | CN111052229B | 公開(公告)日: | 2023-09-01 |
| 發明(設計)人: | 趙璞升;迭戈·米倫多·卡薩多;伊格納西奧·洛佩斯·莫雷諾 | 申請(專利權)人: | 谷歌有限責任公司 |
| 主分類號: | G10L15/22 | 分類號: | G10L15/22;G10L15/00;G10L15/26;G10L15/183 |
| 代理公司: | 中原信達知識產權代理有限責任公司 11219 | 代理人: | 周亞榮;鄧聰惠 |
| 地址: | 美國加利*** | 國省代碼: | 暫無信息 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 自動 確定 用于 經由 自動化 助理 接口 接收 口頭 話語 語音 辨識 語言 | ||
1.一種由一個或多個處理器實現的方法,所述方法包括:
接收與用戶的口頭話語相對應的音頻數據,所述音頻數據基于在客戶端設備處對所述口頭話語的檢測,所述客戶端設備包括用于與自動化助理交互的自動化助理接口;
使用與第一語言相對應的第一語音辨識模型來處理所述音頻數據;
基于使用所述第一語音辨識模型來處理所述音頻數據而確定響應于所述用戶的口頭話語的內容;
使所述客戶端設備將所述內容渲染給所述用戶,其中,所述內容包括索求來自所述用戶的進一步輸入的提示;
響應于確定所述內容包括所述提示,針對附加口頭輸入進行監視;
在所述監視期間接收與附加口頭話語相對應的附加音頻數據,所述附加音頻數據基于通過所述客戶端設備的所述自動化助理接口對所述附加口頭話語的檢測;
在確定要響應于所述附加口頭話語而提供的進一步響應內容時,確定是利用針對所述第一語言的所述第一語音辨識模型還是針對第二語言的第二語音辨識模型,其中,在確定所述進一步響應內容時確定是利用所述第一語音辨識模型還是所述第二語音辨識模型是基于與用于針對來自所述用戶的所述附加口頭輸入進行監視的時間段相對應的監視持續時間,其中,隨著所述監視持續時間增加,利用所述第二語音辨識模型的概率增加;以及
使所述客戶端設備渲染所述進一步響應內容。
2.根據權利要求1所述的方法,其中,在確定所述進一步響應內容時確定是利用所述第一語音辨識模型還是所述第二語音辨識模型是基于與所述用戶的所述附加口頭話語的持續時間相對應的輸入持續時間。
3.根據權利要求2所述的方法,其中,隨著所述輸入持續時間增加,利用所述第二語音辨識模型的概率增加。
4.根據權利要求2所述的方法,還包括:
基于所述提示來識別用于所述附加口頭話語的預期持續時間;
其中,基于所述輸入持續時間來確定是利用所述第一語音辨識模型還是所述第二語音辨識模型是基于所述預期持續時間與所述輸入持續時間的比較,并且隨著基于所述比較的差增加,利用所述第二語音辨識模型的所述概率增加。
5.根據權利要求1所述的方法,其中,在確定所述進一步響應內容時確定是利用所述第一語音辨識模型還是所述第二語音辨識模型是基于用于所述附加口頭話語的預期輸入類型。
6.根據權利要求5所述的方法,其中,在確定所述進一步響應內容時確定是利用所述第一語音辨識模型還是所述第二語音辨識模型包括:
針對所述用戶識別第一量度,所述第一量度基于所述用戶響應于所述預期輸入類型的過去提示而以所述第一語言進行的過去輸入;
針對所述用戶識別第二量度,所述第二量度基于所述用戶響應于所述預期輸入類型的過去提示而以所述第二語言進行的過去輸入;以及
基于所述第一量度和所述第二量度來確定是利用所述第一語音辨識模型還是所述第二語音辨識模型。
7.根據權利要求6所述的方法,還包括:
基于所述音頻數據或者基于來自所述客戶端設備的一個或多個附加傳感器的附加傳感器數據來識別用于所述用戶的用戶簡檔;
其中,針對所述用戶識別所述第一量度和所述第二量度是基于所述第一量度和所述第二量度與所述用戶簡檔關聯地被存儲。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于谷歌有限責任公司,未經谷歌有限責任公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201880039579.9/1.html,轉載請聲明來源鉆瓜專利網。





