[發明專利]外源性大詞匯量模型到基于規則的語音識別的合并在審
| 申請號: | 201910993287.5 | 申請日: | 2015-01-12 |
| 公開(公告)號: | CN110706711A | 公開(公告)日: | 2020-01-17 |
| 發明(設計)人: | T·威爾遜;S·夸齊;J·維孔多阿;P·法特普里亞 | 申請(專利權)人: | 微軟技術許可有限責任公司 |
| 主分類號: | G10L15/32 | 分類號: | G10L15/32;G10L15/30;G10L15/193;G10L15/197 |
| 代理公司: | 72002 永新專利商標代理有限公司 | 代理人: | 賈麗萍 |
| 地址: | 美國華*** | 國省代碼: | 美國;US |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 語音識別系統 大詞匯量 響應發送 觸發 結果發送 統計模型 小詞匯量 語音識別 仲裁算法 錯誤率 外源性 音頻流 詞語 傳輸 合并 檢測 統一 | ||
1.一種用于提供將外源性大詞匯量模型到基于規則的語音識別的合并的方法,包括:
從基于規則的語音識別系統接收第一識別結果,所述第一識別結果包括指定沒有被所述基于規則的語音識別系統所識別的所接收的音頻流的一部分的標記;
對所述音頻流的標記部分執行基于統計模型的識別,以創建第二識別結果;
將所述第二識別結果與所述第一識別結果進行組合,以創建組合的識別結果;并且
將所述組合的識別結果發送至所述基于規則的語音識別系統。
2.根據權利要求1所述的方法,其中,所述第二識別結果是基于統計模型的識別結果。
3.根據權利要求1所述的方法,其中,將所述第二識別結果與所述第一識別結果進行組合包括:用所述第二識別結果來替換所述標記,所述標記指定沒有被所述基于規則的語音識別系統所識別的所述音頻流的所述一部分。
4.根據權利要求1所述的方法,還包括在接收所述第一識別結果之前,對所述音頻流執行基于統計模型的識別。
5.根據權利要求4所述的方法,其中,如果所述第一識別結果包括指定沒有被所述基于規則的語音識別系統所識別的所述音頻流的所述一部分的標記,則:
取消對所述音頻流執行所述基于統計模型的識別;并且
對所述音頻流的所指定的一部分執行所述基于統計模型的識別。
6.根據權利要求1所述的方法,還包括:如果所述第一識別結果不包括指定沒有被基于規則的語音識別系統所識別的所述音頻流的所述一部分的標記,則:
對所述音頻流執行基于統計模型的識別;
分析對所述音頻流的所述基于統計模型的識別的結果和所述第一識別結果;
確定是對所述音頻流的所述基于統計模型的識別的所述結果、還是所述第一識別結果具有更高的識別質量;并且
將具有所述更高的識別質量的識別結果發送至所述基于規則的語音識別系統。
7.一種用于提供語音識別的系統,包括:
一個或多個處理器;以及
耦合至所述一個或多個處理器的存儲器,所述一個或多個處理器可操作以:
接收針對所接收的音頻流的第一識別結果,所述第一識別結果是從基于規則的語音識別系統接收的;
確定所述第一識別結果是否包括指示沒有所述被基于規則的語音識別系統所識別的所述音頻流的一部分的標記;
當確定所述第一識別結果包括所述標記時,對所述音頻流的標記部分執行基于統計模型的識別,以創建第二識別結果;
將所述第二識別結果與第一識別結果進行組合,以創建組合的識別結果;并且
將所述組合的識別結果發送至所述基于規則的語音識別系統。
8.根據權利要求7所述的系統,其中,所述第二識別結果是基于統計模型的識別結果。
9.根據權利要求7所述的系統,其中,所述一個或多個處理器還可操作以用所述第二識別結果來替換指定沒有被所述基于規則的語音識別系統所識別的所述音頻流的所述一部分的所述標記。
10.根據權利要求7所述的系統,其中,所述一個或多個處理器還可操作以在接收所述第一識別結果之前,對所述音頻流執行基于統計模型的識別。
11.根據權利要求10所述的系統,其中,如果所述第一識別結果包括指定沒有被所述基于規則的語音識別系統所識別的所述音頻流的所述一部分的標記,則所述一個或多個處理器還可操作以:
取消對所述音頻流執行所述基于統計模型的識別;并且
對所述音頻流的所指定的一部分執行所述基于統計模型的識別。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于微軟技術許可有限責任公司,未經微軟技術許可有限責任公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910993287.5/1.html,轉載請聲明來源鉆瓜專利網。





