[發明專利]語音識別系統在審
| 申請號: | 202110154554.7 | 申請日: | 2016-12-23 |
| 公開(公告)號: | CN112992146A | 公開(公告)日: | 2021-06-18 |
| 發明(設計)人: | 佩德羅·J·莫雷諾·門吉巴爾;彼塔爾·阿列克西克 | 申請(專利權)人: | 谷歌有限責任公司 |
| 主分類號: | G10L15/26 | 分類號: | G10L15/26;G10L15/08 |
| 代理公司: | 中原信達知識產權代理有限責任公司 11219 | 代理人: | 周亞榮;鄧聰惠 |
| 地址: | 美國加利*** | 國省代碼: | 暫無信息 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 語音 識別 系統 | ||
本公開涉及語音識別系統。提供了一種語音識別系統以及用于語音識別的方法和裝置,其包括被編碼在計算機存儲介質上的計算機程序。在一個方面,一種方法包括下列步驟:接收語音輸入;確定該語音輸入的轉錄文字,其中,對于該語音輸入的多個分段,確定該語音輸入的轉錄文字的步驟包括:獲取該語音輸入的第一分段的第一候選轉錄文字;確定與該第一候選轉錄文字相關聯的一個或多個場境;調整所述一個或多個場境中的每一個場境的相應權重;以及,部分地基于調整后的權重來確定該語音輸入的第二分段的第二候選轉錄文字;以及,提供該語音輸入的所述多個分段的轉錄文字以供輸出。
分案說明
本申請屬于申請日為2016年12月23日的中國發明專利申請201611207951.1的分案申請。
技術領域
本公開涉及語音識別。
背景技術
常規的語音識別系統旨在將來自用戶的語音輸入轉換為文本輸出。該文本輸出可用于各種用途,例如包括:作為搜索查詢、命令、文字處理輸入等。在典型的語音搜索系統中,語音界面接收用戶的語音輸入并將該語音輸入提供給語音識別引擎。語音識別引擎將該語音輸入轉換為文本搜索查詢。語音搜索系統然后向搜索引擎提交該文本搜索查詢,以獲得一個或多個搜索結果。
發明內容
總的來說,本說明書中描述的主題的一個創新方面可以實施在以下方法中,該方法包括以下步驟:接收將語音輸入編碼的數據;確定該語音輸入的轉錄文字(transcription),其中,對于該語音輸入的多個分段,確定該語音輸入的轉錄文字包括:獲取該語音輸入的第一分段的第一候選轉錄文字;確定與該第一候選轉錄文字相關聯的一個或多個場境(contexts);調整所述一個或多個場境中的每一個場境的相應權重;以及部分地基于調整后的權重來確定該語音輸入的第二分段的第二候選轉錄文字;以及,提供該語音輸入的所述多個分段的轉錄文字以供輸出。本說明書中描述的方法可以實施為計算機實現的方法。此方面的其他實施例包括相應的計算機系統、裝置和記錄在一個或多個計算機存儲設備上的計算機程序中,該計算機系統、裝置和計算機程序中的每一個均被配置為執行所述方法的步驟。對于要配置成執行特定操作或動作的一個或多個計算機的系統,意味著該系統已安裝于在操作中使該系統執行所述操作或動作的軟件、固件、硬件或其組合上。對于要配置成執行特定操作或動作的一個或多個計算機程序,意味著所述一個或多個程序包括如下的指令:當該指令被數據處理裝置執行時,該指令使裝置執行所述操作或動作。
本說明書中描述的主題的另一創新方面可以實施為存儲有軟件的計算機可讀介質,該軟件包括可由一個或多個計算機執行的指令,當進行這種執行時,該指令使所述一個或多個計算機執行以下操作,包括:接收將語音輸入編碼的數據;確定該語音輸入的轉錄文字,其中,對于該語音輸入的多個分段,確定該語音輸入的轉錄文字包括:獲取該語音輸入的第一分段的第一候選轉錄文字;確定與第一候選轉錄文字相關聯的一個或多個場境;調整所述一個或多個場境中的每一個場境的相應權重;以及,部分地基于調整后的權重來確定該語音輸入的第二分段的第二候選轉錄文字;以及,提供該語音輸入的所述多個分段的轉錄文字以供輸出。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于谷歌有限責任公司,未經谷歌有限責任公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110154554.7/2.html,轉載請聲明來源鉆瓜專利網。





