[發明專利]語音識別系統有效
| 申請號: | 201611207951.1 | 申請日: | 2016-12-23 |
| 公開(公告)號: | CN107039040B | 公開(公告)日: | 2021-02-12 |
| 發明(設計)人: | 佩德羅·J·莫雷諾·門吉巴爾;彼塔爾·阿列克西克 | 申請(專利權)人: | 谷歌有限責任公司 |
| 主分類號: | G10L15/26 | 分類號: | G10L15/26;G10L15/08 |
| 代理公司: | 中原信達知識產權代理有限責任公司 11219 | 代理人: | 周亞榮;安翔 |
| 地址: | 美國加利*** | 國省代碼: | 暫無信息 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 語音 識別 系統 | ||
本發明提供了一種語音識別系統以及用于語音識別的方法和裝置,其包括被編碼在計算機存儲介質上的計算機程序。在一個方面,一種方法包括下列步驟:接收語音輸入;確定該語音輸入的轉錄文字,其中,對于該語音輸入的多個分段,確定該語音輸入的轉錄文字的步驟包括:獲取該語音輸入的第一分段的第一候選轉錄文字;確定與該第一候選轉錄文字相關聯的一個或多個場境;調整所述一個或多個場境中的每一個場境的相應權重;以及,部分地基于調整后的權重來確定該語音輸入的第二分段的第二候選轉錄文字;以及,提供該語音輸入的所述多個分段的轉錄文字以供輸出。
技術領域
本發明涉及語音識別。
背景技術
常規的語音識別系統旨在將來自用戶的語音輸入轉換為文本輸出。該文本輸出可用于各種用途,例如包括:作為搜索查詢、命令、文字處理輸入等。在典型的語音搜索系統中,語音界面接收用戶的語音輸入并將該語音輸入提供給語音識別引擎。語音識別引擎將該語音輸入轉換為文本搜索查詢。語音搜索系統然后向搜索引擎提交該文本搜索查詢,以獲得一個或多個搜索結果。
發明內容
總的來說,本說明書中描述的主題的一個創新方面可以實施在以下方法中,該方法包括以下步驟:接收將語音輸入編碼的數據;確定該語音輸入的轉錄文字(transcription),其中,對于該語音輸入的多個分段,確定該語音輸入的轉錄文字包括:獲取該語音輸入的第一分段的第一候選轉錄文字;確定與該第一候選轉錄文字相關聯的一個或多個場境(contexts);調整所述一個或多個場境中的每一個場境的相應權重;以及部分地基于調整后的權重來確定該語音輸入的第二分段的第二候選轉錄文字;以及,提供該語音輸入的所述多個分段的轉錄文字以供輸出。本說明書中描述的方法可以實施為計算機實現的方法。此方面的其他實施例包括相應的計算機系統、裝置和記錄在一個或多個計算機存儲設備上的計算機程序中,該計算機系統、裝置和計算機程序中的每一個均被配置為執行所述方法的步驟。對于要配置成執行特定操作或動作的一個或多個計算機的系統,意味著該系統已安裝于在操作中使該系統執行所述操作或動作的軟件、固件、硬件或其組合上。對于要配置成執行特定操作或動作的一個或多個計算機程序,意味著所述一個或多個程序包括如下的指令:當該指令被數據處理裝置執行時,該指令使裝置執行所述操作或動作。
本說明書中描述的主題的另一創新方面可以實施為存儲有軟件的計算機可讀介質,該軟件包括可由一個或多個計算機執行的指令,當進行這種執行時,該指令使所述一個或多個計算機執行以下操作,包括:接收將語音輸入編碼的數據;確定該語音輸入的轉錄文字,其中,對于該語音輸入的多個分段,確定該語音輸入的轉錄文字包括:獲取該語音輸入的第一分段的第一候選轉錄文字;確定與第一候選轉錄文字相關聯的一個或多個場境;調整所述一個或多個場境中的每一個場境的相應權重;以及,部分地基于調整后的權重來確定該語音輸入的第二分段的第二候選轉錄文字;以及,提供該語音輸入的所述多個分段的轉錄文字以供輸出。
前述和其它實施例中的每一個均能夠可選地包括以下特征中的一個或多個(單獨地或以它們的任何組合)。例如,一個實施例包括以下所有特征的組合。所述方法包括獲取語音輸入的第一分段的第一候選轉錄文字:確定該語音輸入的第一分段滿足穩定性標準;以及,響應于確定該語音輸入的第一分段滿足穩定性標準來獲取該語音輸入的第一分段的第一候選轉錄文字。所述穩定性標準包括該語音輸入的第一分段的一個或多個語義特征(semantic characteristics)。所述穩定性標準包括該語音輸入的第一分段之后發生的時間延遲。該語音輸入的第二分段出現在該語音輸入的第一分段之后。所述一個或多個場境是從用戶設備接收的。所述一個或多個場境包括以下的數據:該數據包括用戶的地理位置、用戶的搜索歷史、用戶的興趣、或用戶的活動。所述方法包括:存儲對多個場境的多個評分;以及,響應于對所述一個或多個場境中的每一個場境的相應權重的調整來更新所述一個或多個場境的調整后的評分。所述方法還包括將該輸出作為一個搜索查詢(search query)來提供,例如提供給搜索引擎,然后,搜索引擎可以響應于該搜索查詢而向用戶設備提供一個或多個搜索結果。所述第一候選轉錄文字包括單詞、子詞或詞組。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于谷歌有限責任公司,未經谷歌有限責任公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201611207951.1/2.html,轉載請聲明來源鉆瓜專利網。





