[發明專利]語音識別系統有效
| 申請號: | 201611207951.1 | 申請日: | 2016-12-23 |
| 公開(公告)號: | CN107039040B | 公開(公告)日: | 2021-02-12 |
| 發明(設計)人: | 佩德羅·J·莫雷諾·門吉巴爾;彼塔爾·阿列克西克 | 申請(專利權)人: | 谷歌有限責任公司 |
| 主分類號: | G10L15/26 | 分類號: | G10L15/26;G10L15/08 |
| 代理公司: | 中原信達知識產權代理有限責任公司 11219 | 代理人: | 周亞榮;安翔 |
| 地址: | 美國加利*** | 國省代碼: | 暫無信息 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 語音 識別 系統 | ||
1.一種用于語音識別的方法,包括:
接收表示語音輸入的數據;
確定所述語音輸入的轉錄文字,其中,對于所述語音輸入的多個分段,確定所述語音輸入的轉錄文字的步驟包括:
維護多個場境和與所述多個場境相關聯的相應基本權重;
獲取所述語音輸入的第一分段的第一候選轉錄文字;
從所述多個場境確定與所述第一候選轉錄文字相關聯的一個或多個場境;
識別分別與所述一個或多個場境相對應的一個或多個基本權重;
基于所述第一候選轉錄文字來調整所述一個或多個場境中的每一個場境的所述一個或多個基本權重中的相應基本權重;以及
部分地基于所述一個或多個場境中的每一個場境的調整后的基本權重來確定所述語音輸入的第二分段的第二候選轉錄文字;以及
提供所述語音輸入的所述多個分段的轉錄文字以供輸出。
2.根據權利要求1所述的方法,其中,獲取所述語音輸入的第一分段的第一候選轉錄文字包括:
確定所述語音輸入的所述第一分段滿足穩定性標準;以及
響應于確定所述語音輸入的所述第一分段滿足穩定性標準來獲取所述語音輸入的所述第一分段的所述第一候選轉錄文字。
3.根據權利要求2所述的方法,其中,所述穩定性標準包括所述語音輸入的所述第一分段的一個或多個語義特征。
4.根據權利要求2所述的方法,其中,所述穩定性標準包括在所述語音輸入的所述第一分段之后產生的時間延遲。
5.根據權利要求1所述的方法,其中,所述語音輸入的所述第二分段出現在所述語音輸入的所述第一分段之后。
6.根據權利要求1所述的方法,其中,所述一個或多個場境是從用戶設備接收的。
7.根據權利要求6所述的方法,其中,所述一個或多個場境包括以下數據,該數據包括以下項中的一個或多個:用戶的地理位置、用戶的搜索歷史、用戶的興趣和用戶的活動。
8.根據權利要求1至7中的任一項所述的方法,包括:
存儲多個場境的多個分值;以及
響應于對所述一個或多個場境中的每一個場境的相應基本權重的調整,基于調整后的基本權重來更新所述一個或多個場境的分值。
9.根據權利要求1至7中的任一項所述的方法,還包括:
提供所述輸出而作為一個搜索查詢。
10.根據權利要求1所述的方法,其中,所述第一候選轉錄文字包括單詞、子詞或詞組。
11.一種用于語音識別的系統,包括:
一個或多個計算機和存儲有指令的一個或多個存儲設備,所述指令在由所述一個或多個計算機執行時使所述一個或多個計算機執行以下操作,包括:
接收表示語音輸入的數據;
確定所述語音輸入的轉錄文字,其中,對于所述語音輸入的多個分段,確定所述語音輸入的所述轉錄文字包括:
維護多個場境和與所述多個場境相關聯的相應基本權重;
獲取所述語音輸入的第一分段的第一候選轉錄文字;
從所述多個場境確定與所述第一候選轉錄文字相關聯的一個或多個場境;
識別分別與所述一個或多個場境相對應的一個或多個基本權重;
基于所述第一候選轉錄文字來調整所述一個或多個場境中的每一個場境的所述一個或多個基本權重中的相應基本權重;以及
部分地基于所述一個或多個場境中的每一個場境的調整后的基本權重來確定所述語音輸入的第二分段的第二候選轉錄文字;以及
提供所述語音輸入的所述多個分段的轉錄文字以供輸出。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于谷歌有限責任公司,未經谷歌有限責任公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201611207951.1/1.html,轉載請聲明來源鉆瓜專利網。





