[發明專利]基于定向降噪與干聲提取技術的語音優化方法在審
| 申請號: | 202110587258.6 | 申請日: | 2021-05-27 |
| 公開(公告)號: | CN113314136A | 公開(公告)日: | 2021-08-27 |
| 發明(設計)人: | 譚浩;劉天翼;郭哲宇;郝佳晨;樊書宏 | 申請(專利權)人: | 西安電子科技大學 |
| 主分類號: | G10L21/0208 | 分類號: | G10L21/0208;G10L25/30;G10L25/60 |
| 代理公司: | 北京神州信德知識產權代理事務所(普通合伙) 11814 | 代理人: | 劉真 |
| 地址: | 710126 陜西*** | 國省代碼: | 陜西;61 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 定向 提取 技術 語音 優化 方法 | ||
本發明是一種基于定向降噪與干聲提取技術的語音優化方法,該方法包括以下步驟:S1、建立聲音庫;S2、定義使用的環境;S3、構建深度語音去噪自監督語音增強全卷積神經網絡;S4、進行聲音增強。本發明能夠針對餐廳、室外、馬路等不同的場景進行降噪,大大提升了降噪的效果。
技術領域
本發明屬于音頻處理的技術領域,特別涉及一種基于定向降噪與干聲提取技術的語音優化方法。
背景技術
在音頻處理過程中,主要有定向降噪和干聲提取兩種方式。
目前,定向降噪對音頻降噪算法的研究主要集中在非壓縮域音頻的處理,主要的降噪方法有:譜減法、維納濾波法和門限閾值法。經典的譜減法在假定噪聲和信號相互獨立的條件下,從含有噪聲的信號譜中減去噪聲譜,從而實現降噪。譜減法相對簡單,但噪聲和信號相互獨立的假設并不完全相符,這使得采用譜減法降噪處理后的音頻中殘留有很大的音樂噪聲;基于音頻時頻塊的自適應閾值降噪算法在噪聲方差已知的條件下,通過最小Stein風險估計法自適應地調整時頻塊的參數,對各種類型的音頻都具有良好的降噪效果。
干聲提取方法中,也有兩種:
(1)基于計算聽覺場景分析(CASA)的人聲分離算法根據每個說話人語音的基音、音色等特征的不同,利用聚類與DNN的方法分離人聲。然而,DNN訓練得到的人聲分離模型常常存在排列問題,即當一段混合語音中包含兩個或多個說話人時,DNN輸出分離語音的順序是未知的,導致模型在訓練時無法利用目標語音與對應的分離語音間的誤差來提升分離效果。
(2)Hershey等提出深度聚類(DC)算法,算法將混合語音的時頻幅度譜映射到一個嵌入空間中,使同一聲源的時頻點間的相似度最小、不同聲源的時頻點間的相似度最大,從而避免了排列問題帶來的影響。Luo,Chen等根據DC算法改進的深度吸引子網絡(DANet)在嵌入空間中計算得到吸引子,利用各吸引子與其同源的時頻點間的相似度變高這一特性來計算分離掩蔽,同時在訓練時利用了目標語音與其分離語音的誤差來提升網絡性能。
然而,定向降噪算法需要從含有噪聲的音頻信號中估計出噪聲方差,噪聲方差估計的準確度直接影響了降噪后音頻的質量。干聲提取所需要的數據量較大,總而言之目前的一些音頻降噪算法效果都不是十分理想。
發明內容
為解決上述問題,本發明的首要目的在于提供一種基于定向降噪與干聲提取技術的語音優化方法,該方法分別使用SSD和HSD方法處理帶噪語音和去噪語音信號在不同噪聲類型下的平均PESQ(Perceptual evaluation of speech quality客觀語音質量評估)和STOI(Short-Time Objective Intelligibility可短時客觀可懂)。
本發明的另一目的在于提供一種基于定向降噪與干聲提取技術的語音優化方法,該方法使用log-mel圖譜系數(MFSC)省略離散余弦變換(DCT)壓縮;使用能量對書譜作為輸入和輸出的方法和masking-based方法估計一個語音信號進行去噪,去噪效果好。
為實現上述目的,本發明的技術方案如下。
一種基于音頻場景識別的的定向降噪方法,包括以下步驟:
S1、建立聲音庫;
S2、定義使用的環境;
S3、構建深度語音去噪自監督語音增強全卷積神經網絡;
S4、進行聲音增強。
其中,S1、建立聲音庫步驟中,
采用TIMIT語料庫,語料庫中的音頻文件由若干個講話者(其中,男女各一半)組成的復數個語音音頻文件組成,每個音頻文件長度約為15s。
上述音頻文件為干凈語音信號,將干凈語音信號通過UrbanSound8K數據集的噪聲信號破壞。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于西安電子科技大學,未經西安電子科技大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110587258.6/2.html,轉載請聲明來源鉆瓜專利網。





