[發明專利]語音識別結果修正方法、系統、終端以及儲存介質在審
| 申請號: | 202010525326.1 | 申請日: | 2020-06-10 |
| 公開(公告)號: | CN111666750A | 公開(公告)日: | 2020-09-15 |
| 發明(設計)人: | 周康明;吳昊 | 申請(專利權)人: | 上海眼控科技股份有限公司 |
| 主分類號: | G06F40/232 | 分類號: | G06F40/232;G06F40/242;G06F40/295 |
| 代理公司: | 上海光華專利事務所(普通合伙) 31219 | 代理人: | 倪靜 |
| 地址: | 200032 上海市徐匯*** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 語音 識別 結果 修正 方法 系統 終端 以及 儲存 介質 | ||
1.一種語音識別修正方法,其特征在于,包括:
構建語料庫;
從所述語料庫中篩選出符合相關度要求的一或多個語料,以形成對應的修正語料文檔;
根據所述修正語料文檔,生成對應的修正數據輸入方式和修正語料庫字典文檔;
根據所述修正數據輸入方式和修正語料庫字典文檔來訓練一ELMo模型,以用于對所述修正語料庫字典文檔進行向量化處理后得到修正向量文檔;
將修正向量文檔和修正語料庫字典文檔送入到所述ELMo模型,以生成語音識別修正模型;
將待識別語音語料文檔輸入所述語音識別修正模型,得到與所述待識別語音語料文檔對應的語音識別修正結果。
2.根據權利要求1所述的語音識別結果修正方法,其特征在于,從所述語料庫中篩選出符合相關度要求的一或多個語料,以形成對應的語料文檔的方式包括:
獲取所述語料庫;
將所述語料庫中的空白文檔以及無關聯詞語作為不符合相關度要求的語料刪除;
將刪除后的語料庫中的一或多個語料集合成對應的語料文檔。
3.根據權利要求1所述的語音識別結果修正方法,其特征在于,根據所述語料文檔,生成對應的數據輸入方式和語料庫字典文檔的方式包括:
將所述語料文檔進行分詞并按行儲存;
將經過分詞后的語料文檔拆解為多行字符,并儲存至預處理文檔;
構建語料庫字典文檔,并將所述預處理文檔中語料庫字典文檔中不存在的字符儲存至所述語料庫字典文檔;
將所述語料文檔中的中文語料轉為無聲調拼音,并設于所述中文語料后儲存至數據輸入方式文檔以及所述語料庫字典文檔。
4.根據權利要求1所述的語音識別結果修正方法,其特征在于,根據所述數據輸入方式和語料庫字典文檔來訓練一ELMo模型,以用于對所述語料庫字典文檔進行向量化處理后得到向量文檔的方式包括:
輸入儲存由所述語料文檔中的中文語料轉為無聲調拼音以及所述中文語料的數據輸入方式文檔與所述語料庫字典文檔;
對所述語料庫字典文檔中的字符進行編碼并進行高速神經網絡層的篩選;
將篩選后的所述語料庫字典文檔通過雙向長短時結構提取當前序列的上下文信息以得到ELMo模型;
利用所述ELMo模型對所述語料庫字典文檔進行向量化表示,并儲存至向量文檔。
5.根據權利要求1所述的語音識別結果修正方法,其特征在于,根據所述向量文檔和語料庫字典文檔來調整所述ELMo模型,以生成用于修正語音識別結果的命名實體識別模型的方式包括:
將所述命名實體識別網絡的最后一層的條件隨機場函數層修改為分類函數層,生成命名實體識別模型;
載入儲存由所述語料文檔中的中文語料轉為無聲調拼音以及所述中文語料的數據輸入方式文檔與包括所述語料庫字典向量文檔向量化的向量文檔;
利用所述向量文檔對所述數據輸入方式文檔進行向量化;
利用所向量化的所述數據輸入方式文檔對所述命名實體識別模型進行訓練得到用于修正語音識別結果的命名實體識別模型。
6.根據權利要求5所述的語音識別結果修正方法,其特征在于,利用所向量化的所述第二預處理文檔對所述命名實體識別模型進行訓練還包括:得到語料的標簽概率分布,采用分類函數進行分類,以輸出概率閾值內的標簽值。
7.根據權利要求1所述的語音識別結果修正方法,其特征在于,所述語料庫包括:氣象語料庫。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于上海眼控科技股份有限公司,未經上海眼控科技股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010525326.1/1.html,轉載請聲明來源鉆瓜專利網。





