[發明專利]一種基于人工智能的語音增強方法在審
| 申請號: | 202010551206.9 | 申請日: | 2020-06-16 |
| 公開(公告)號: | CN111833893A | 公開(公告)日: | 2020-10-27 |
| 發明(設計)人: | 王亞東 | 申請(專利權)人: | 杭州云嘉云計算有限公司 |
| 主分類號: | G10L21/0208 | 分類號: | G10L21/0208;G10L15/20 |
| 代理公司: | 杭州杭誠專利事務所有限公司 33109 | 代理人: | 尉偉敏 |
| 地址: | 311100 浙江省杭州市余*** | 國省代碼: | 浙江;33 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 人工智能 語音 增強 方法 | ||
本發明公開了一種基于人工智能的語音增強方法。為了克服現有技術數據處理復雜,模型臃腫,訓練難度大,計算速度慢,靈活性差的問題;本發明包括以下步驟:S1:訓練數據預處理;提取音頻數據的時域序列,進行切片處理;S2:模型訓練和部署;建立GAN算法模型,根據音頻數據模擬進行對抗式訓練;將訓練完成的GAN算法模型部署到機器的服務器中;S3:模型測試;對測試數據中的帶噪音頻進行切片處理,在訓練完成的GAN算法模型中進行數據除噪與音頻重構,完成音頻的語音增強;S4:模型評估優化;采用多種方式對語音增強后的音頻質量進行評估。本方案基于GAN算法模型,模型結構簡單,占用空間小,數據預處理簡單,減小了訓練難度,能夠靈活調用。
技術領域
本發明涉及一種語音處理技術領域,尤其涉及一種基于人工智能的語音增強方法。
背景技術
在接收語音信號的同時,語音總是不可避免地受到噪聲的干擾,或是遇到采音效果差等問題,這些干擾不僅造成語音污染,還會導致語音識別系統性能的惡化。一方面,受噪聲污染的音頻會惡化人的聽感;另一方面,也一定程度上影響了語音識別系統的性能。因此,如何從含噪語音中提取盡可能純凈的原始語音,維持音頻的聲音強度,改善音頻的可聽性,是語音識別工作的一項重要內容。語音增強作為一種預處理方案,是改善智能語音服務和提高音頻可聽性的有效手段。
現有的語音增強的手段,例如,一種在中國專利文獻上公開的“語音增強方法”,其公告號CN110767244A,包括:提取各語音幀的聲學特征;利用干凈語音的與噪聲語音的樣本對漸進式雙輸出神經網絡模型進行訓練,利用訓練后的漸進式雙輸出神經網絡模型估計各語音幀的理想軟掩蔽,并進行聲學特征的增強處理;如果應用到人耳,則利用增強后的聲學特征對波形進行重構,得到可主觀測聽的波形;如果應用到語音識別系統,則將估計到的理想軟掩蔽應用到輸入語音的聲學特征上,得到掩蔽后的聲學特征,然后對波形進行重構得到增強后的語音。
現有的語音增強的技術手段數據預處理復雜,需要做頻域變換,分幀后還需再做拼接等處理;需先后訓練多個模型,全連接結構參數量大,導致網絡訓練難度大,時間長;在面對一個新的噪聲場景時,需要從新進行模型的訓練;模型臃腫,計算速度慢。
發明內容
本發明主要解決現有技術數據處理復雜,模型臃腫,訓練難度大,計算速度慢,靈活性差的問題;提供一種基于人工智能的語音增強方法,只需要一個GAN模型,就可以完成帶噪音頻的去噪工作,占用空間小,數據處理過程簡單,訓練難度減低。
本發明的上述技術問題主要是通過下述技術方案得以解決的:
本發明包括以下步驟:
S1:訓練數據預處理;提取音頻數據的時域序列,對音頻數據進行切片處理;
S2:模型訓練和部署;建立GAN算法模型,根據音頻數據模擬進行對抗式訓練;將訓練完成的GAN算法模型部署到機器的服務器中;
S3:模型測試;對測試數據中的帶噪音頻進行切片處理,再訓練完成的GAN算法模型中進行數據除噪與音頻重構,完成音頻的語音增強;
S4:模型評估優化;采用多種方式對語音增強后的音頻質量進行評估。
本方案基于生成對抗網絡(GAN)算法模型,模型結構簡單,占用空間小,減小了訓練難度,能夠通過移動介質靈活轉移和部署到服務端,滿足用戶的靈活調用。本方案采用端到端技術,直接對音頻的時域序列進行處理,避免了復雜的數據預處理過程;用戶只需要提供帶噪音頻,啟動的服務即可自行進行音頻切分并完成去噪,重構等過程,最終反饋給用戶去除噪聲的音頻。
作為優選,GAN算法模型包括生成器G和判別器D;
生成器G模擬輸入的真實音頻數據分布的有效映射,生成與訓練數據相關的新樣本;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于杭州云嘉云計算有限公司,未經杭州云嘉云計算有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010551206.9/2.html,轉載請聲明來源鉆瓜專利網。





