[發明專利]語音識別模型的訓練、人機交互方法、設備和存儲介質在審
| 申請號: | 202111054577.7 | 申請日: | 2021-09-09 |
| 公開(公告)號: | CN113744737A | 公開(公告)日: | 2021-12-03 |
| 發明(設計)人: | 鐘業榮;葉萬余;阮國恒;江嘉銘;阮偉聰;張名捷;黃一捷;楊毅;倪進超 | 申請(專利權)人: | 廣東電網有限責任公司;廣東電網有限責任公司清遠供電局 |
| 主分類號: | G10L15/26 | 分類號: | G10L15/26;G10L15/02;G10L15/16;G10L15/28 |
| 代理公司: | 北京品源專利代理有限公司 11332 | 代理人: | 王瑞云 |
| 地址: | 510000 廣東*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 語音 識別 模型 訓練 人機交互 方法 設備 存儲 介質 | ||
1.一種語音識別模型的訓練方法,其特征在于,包括:
獲取屬于非電力行業的第一語音數據、作為所述第一語音數據的內容的第一文本信息;
獲取屬于電力行業的術語;
將所述術語融入所述第一文本信息,獲得屬于所述電力行業的第二文本信息;
校驗所述第二文本信息對于所述電力行業的合法性;
若所述第二文本信息對于所述電力行業合法,則將所述術語融入所述第一語音數據,獲得屬于所述電力行業的第二語音數據;
以所述第二語音數據為樣本、所述第二文本信息為標簽,訓練語音識別模型,以將屬于所述電力行業的語音數據轉換為文本信息。
2.根據權利要求1所述的方法,其特征在于,所述將所述術語融入所述第一文本信息,獲得屬于所述電力行業的第二文本信息,包括:
按照語法結構將所述第一文本信息劃分為多個第一關鍵詞;
確定所述第一關鍵詞的第一長度;
在所述第一文本信息中,將符合目標條件的所述術語替換所述第一關鍵詞,獲得屬于所述電力行業的第二文本信息;
其中,所述目標條件包括所述術語的第二長度與所述第一長度之間的差異小于或等于第一閾值,所述術語適用于所述語法結構。
3.根據權利要求1所述的方法,其特征在于,所述校驗所述第二文本信息對于所述電力行業的合法性,包括:
獲取屬于所述電力行業的第三文本信息;
計算所述第二文本信息與所述第三文本信息之間的相似度;
計算所述第二文本信息中、包含所述術語的語法結構在所述第三文本信息中的分布概率;
若所述相似度大于或等于第二閾值、且所述分布概率大于或等于第三閾值,則確定所述第二文本信息對于所述電力行業合法。
4.根據權利要求3所述的方法,其特征在于,所述計算所述第二文本信息中包含所述術語的語法結構在所述第三文本信息中的分布概率,包括:
查詢所述第三文本信息中的第二關鍵詞;
統計各個所述第二關鍵詞在所述第三文本信息中的依賴概率,其中,所述依賴概率為第一詞頻數與第二詞頻數的比值,所述第一詞頻數為當前所述第二關鍵詞在所述第三文本信息中出現在其他所述第二關鍵詞之后的詞頻數,所述第二詞頻數為其他所述第二關鍵詞在所述第三文本信息中的總詞頻數;
當所述術語與當前所述第二關鍵詞相同、且第一關鍵詞與其他所述第二關鍵詞相同時,將所述依賴概率設置為所述第二文本信息中、包含所述術語的語法結構在所述第三文本信息中的分布概率,所述第一關鍵詞為在所述第一文本信息中被所述術語替換的關鍵詞。
5.根據權利要求1-4中任一項所述的方法,其特征在于,所述將所述術語融入所述第一語音數據,獲得屬于所述電力行業的第二語音數據,包括:
在所述第一語音數據中查詢內容為第一關鍵詞的第一語音信號,所述第一關鍵詞為在所述第一文本信息中被所述術語替換的關鍵詞;
確定語音轉換模型,所述語音轉換模型用于將文本信息轉換為語音信號;
調用所述語音轉換模型將所述術語轉換為第二語音信號;
在所述第一語音數據中,將所述第二語音信號替換所述第一語音信號,獲得屬于所述電力行業的第二語音數據。
6.根據權利要求5所述的方法,其特征在于,所述調用所述語音轉換模型將所述術語轉換為第二語音信號,包括:
獲取第三語音數據、作為所述第三語音數據的內容的第四文本信息,所述第三語音數據的音色與所述第一語音數據的音色相同;
以所述第一語音數據與所述第三語音數據為樣本、所述第一文本信息與所述第四文本信息為標簽,更新所述語音轉換模型,以使所述語音轉換模型用于合成所述音色的語音信號;
在限定所述音色的條件下,將所述術語輸入更新之后的所述語音轉換模型中進行處理,獲得音色與所述第一語音數據相同的第二語音信號。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于廣東電網有限責任公司;廣東電網有限責任公司清遠供電局,未經廣東電網有限責任公司;廣東電網有限責任公司清遠供電局許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202111054577.7/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:模板清理裝置
- 下一篇:一種配送點位顯示方法、裝置、機器人及存儲介質





