[發明專利]音頻訓練數據處理方法、裝置、設備以及存儲介質有效
| 申請號: | 202011333454.2 | 申請日: | 2020-11-24 |
| 公開(公告)號: | CN112614478B | 公開(公告)日: | 2021-08-24 |
| 發明(設計)人: | 劉龍飛;陳昌濱 | 申請(專利權)人: | 北京百度網訊科技有限公司 |
| 主分類號: | G10L13/02 | 分類號: | G10L13/02;G10L13/04;G10L25/30;G06N3/08 |
| 代理公司: | 北京清亦華知識產權代理事務所(普通合伙) 11201 | 代理人: | 韓海花 |
| 地址: | 100085 北京市*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 音頻 訓練 數據處理 方法 裝置 設備 以及 存儲 介質 | ||
本申請公開了一種音頻訓練數據處理方法、裝置、設備以及存儲介質,涉及語音技術和深度學習等人工智能技術領域。具體實現方案為:獲取多個待處理音頻文件,計算每個待處理音頻文件的聲紋特征向量;將每個待處理音頻文件的聲紋特征向量和標準特征向量進行匹配,根據匹配結果從多個待處理音頻文件中獲取多個候選音頻文件;獲取多個候選音頻文件對應的多個候選文本信息,計算多個候選音頻文件和多個候選文本信息的對齊似然值;根據每個候選音頻文件的對齊似然值從多個候選音頻文件中獲取多個目標音頻文件。由此,通過基于聲紋特征、以及多讀、少讀等干擾音頻數據對待處理音頻進行過濾,保證音頻訓練數據的準確性,提高后續語音合成模型的穩定性。
技術領域
本申請涉及數據處理技術領域中的語音技術和深度學習等人工智能技術領域,尤其涉及一種音頻訓練數據處理方法、裝置、設備以及存儲介質。
背景技術
人工智能是研究使計算機來模擬人的某些思維過程和智能行為(如學習、推理、思考、規劃等)的學科,既有硬件層面的技術也有軟件層面的技術。人工智能技術一般包括如傳感器、專用人工智能芯片、云計算、分布式存儲、大數據處理等技術;人工智能軟件技術主要包括計算機視覺技術、語音識別技術、自然語言處理技術以及機器學習/深度學習、大數據處理技術、知識圖譜技術等幾個大方向。
通常,個性化語音合成可應用于語音定制,通過深度學習技術,對發言人的風格、韻律、音色等個性化語音特征進行學習,并結合標準的文本轉換語音合成系統,應用于任意文本的語音合成,不需要耗費大量的時間去專業錄音棚錄制語音,然后花費很長周期制作語音包。
相關個性化語音合成技術中,為了保證語音效果,獲取比較大的錄音數量,因此,用戶出現錄音口誤、外界噪聲混入等各種干擾因素發生的概率會增大,用戶在錄音風格的一致性也會出現變化,導致訓練的模型穩定性比較差。
發明內容
本公開提供了一種用于音頻訓練數據處理的方法、裝置、設備以及存儲介質。
根據本公開的一方面,提供了一種音頻訓練數據處理方法,包括:
獲取多個待處理音頻文件,并計算每個待處理音頻文件的聲紋特征向量;
將所述每個待處理音頻文件的聲紋特征向量和標準特征向量進行匹配,根據匹配結果從所述多個待處理音頻文件中獲取多個候選音頻文件;
獲取所述多個候選音頻文件對應的多個候選文本信息,計算所述多個候選音頻文件和所述多個候選文本信息的對齊似然值;
根據每個候選音頻文件的對齊似然值從所述多個候選音頻文件中獲取多個目標音頻文件。
根據本公開的另一方面,提供了一種音頻訓練數據處理裝置,包括:
第一獲取模塊,用于獲取多個待處理音頻文件;
第一計算模塊,用于計算每個待處理音頻文件的聲紋特征向量;
匹配模塊,用于將所述每個待處理音頻文件的聲紋特征向量和標準特征向量進行匹配,根據匹配結果從所述多個待處理音頻文件中獲取多個候選音頻文件;
第二獲取模塊,用于獲取所述多個候選音頻文件對應的多個候選文本信息;
第二計算模塊,用于計算所述多個候選音頻文件和所述多個候選文本信息的對齊似然值;
第三獲取模塊,用于根據每個候選音頻文件的對齊似然值從所述多個候選音頻文件中獲取多個目標音頻文件。
根據第三方面,提供了一種電子設備,包括:至少一個處理器;以及與所述至少一個處理器通信連接的存儲器;其中,所述存儲器存儲有可被所述至少一個處理器執行的指令,所述指令被所述至少一個處理器執行,以使所述至少一個處理器能夠執行上述實施例描述的音頻訓練數據處理方法。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京百度網訊科技有限公司,未經北京百度網訊科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011333454.2/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種電弧爐冶煉的能量輸入控制方法
- 下一篇:一種瓦楞紙裁剪裝置





