[發明專利]特定領域的語音識別模型的構建方法有效
| 申請號: | 202010413228.9 | 申請日: | 2020-05-15 |
| 公開(公告)號: | CN111627427B | 公開(公告)日: | 2023-05-05 |
| 發明(設計)人: | 劉利平;張欣;孔衛東 | 申請(專利權)人: | 北京青牛技術股份有限公司 |
| 主分類號: | G10L15/06 | 分類號: | G10L15/06;G10L15/01 |
| 代理公司: | 北京元合聯合知識產權代理事務所(特殊普通合伙) 11653 | 代理人: | 李非非 |
| 地址: | 100000 北京市石景*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 特定 領域 語音 識別 模型 構建 方法 | ||
1.一種特定領域的語音識別模型的構建方法,該方法包括:
S1.將特定領域的音頻數據進行文本轉錄,以構建所述音頻數據及其對應的轉錄文本組成的訓練集;
S2.將所述訓練集輸入一現有的語音識別模型,對所述語音識別模型執行針對所述特定領域的遷移學習訓練;
S3.選擇所述訓練集的一個子集,將所述子集輸入所述語音識別模型進行語音識別測試;
S4.校準所述語音識別測試的輸出結果,根據校準后的輸出結果更新所述子集,將所述子集輸入所述語音識別模型,對所述語音識別模型執行迭代訓練;
S5.利用根據所述訓練集生成的語言模型,對所述語音識別模型進行超參數調整處理,獲得特定領域的語音識別模型。
2.根據權利要求1所述的特定領域的語音識別模型的構建方法,在執行步驟S5之前,該方法還包括:
S6.重復執行步驟S3和步驟S4,直至所述語音識別模型滿足預定的準確率。
3.根據權利要求1所述的特定領域的語音識別模型的構建方法,其中,步驟S3中選擇所述訓練集的一個子集的步驟包括:
從所述訓練集中選擇多個具有預定準確率的元素組成所述子集。
4.根據權利要求1所述的特定領域的語音識別模型的構建方法,其中,步驟S4中校準所述語音識別測試的輸出結果的步驟包括:
根據預定規則從所述輸出結果中篩選出至少一條待校準數據;
根據人工校準操作更新所述待校準數據。
5.根據權利要求1所述的特定領域的語音識別模型的構建方法,其中,步驟S4中根據校準后的輸出結果更新所述子集的步驟包括:
組織校準后的輸出結果的數據格式,使所述校準后的輸出結果的數據格式與所述訓練集的數據格式相同;
將所述輸出結果合并至所述子集中。
6.根據權利要求1所述的特定領域的語音識別模型的構建方法,其中,所述轉錄文本包括:
由所述特定領域的專業詞匯構成的語料。
7.根據權利要求1所述的特定領域的語音識別模型的構建方法,其中:
所述語言模型包括N-gram模型。
8.一個或多個存儲計算機可執行指令的計算機可讀介質,所述指令在由一個或多個計算機設備使用時使得一個或多個計算機設備執行如權利要求1至7任一項所述的特定領域的語音識別模型的構建方法。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京青牛技術股份有限公司,未經北京青牛技術股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010413228.9/1.html,轉載請聲明來源鉆瓜專利網。





