[發明專利]基于稀疏編碼和理想二進制掩膜相結合的語音增強方法有效

申請號：	201410476932.3	申請日：	2014-09-17
公開（公告）號：	CN104240717B	公開（公告）日：	2017-04-26
發明（設計）人：	湯一彬;談雅文;李旭斐;蔣愛民;徐寧;殷澄	申請（專利權）人：	河海大學常州校區
主分類號：	G10L21/0208	分類號：	G10L21/0208
代理公司：	南京縱橫知識產權代理有限公司32224	代理人：	董建林
地址：	213022 ***	國省代碼：	江蘇;32
權利要求書：	查看更多	說明書：	查看更多
摘要：
搜索關鍵詞：	基于稀疏編碼理想二進制相結合語音增強方法
鉆瓜網技術展會專利詞庫專利權人專利榜在售專利公布日期熱門專利

【權利要求書】：

1.一種基于稀疏編碼和理想二進制掩膜相結合的語音增強方法，其特征在于:首先利用理想的二進制掩膜算法對信號功率譜進行初步降噪處理；其次通過稀疏編碼對處理后的信號做進一步處理，從而實現語音增強的效果，具體包含以下步驟：

(1)將時域信號轉換為頻域信號；

(2)采用理想二進制掩膜算法對語音信號功率譜進行初步降噪處理，包括如下步驟：

(b1)根據語音信號受污染的程度，選定一個閾值；

(b2)計算出每一個時頻點的信噪比，若該時頻點的信噪比大于選定的閾值，則掩膜中相應位置的元素為1；反之，該元素為0；

(b3)將時頻信號和掩膜進行點乘，即可得到經過理想二進制掩膜算法初步處理后的語音信號S^r；(b4)將時頻信號和掩膜的邏輯逆矩陣進行點乘，即可得到在IBM算法中被認為是噪聲的干擾信號V^r；

(3)利用稀疏編碼理論對初步處理后的信號作進一步降噪處理，同時從被認為是干擾信號中提取有效的語音成分，工作過程包括如下步驟：

(c1)根據稀疏理論，將步驟(b3)中初步處理后的語音信號S^r作訓練樣本，采用K-SVD算法訓練出語音信號字典D_s以及相對應的稀疏系數X^e；

(c2)根據稀疏理論，將步驟(b4)中的干擾信號V^r作訓練樣本，同樣采用K-SVD算法訓練出干擾信號字典D_v以及采用正交匹配算法計算出該字典相應的稀疏系數X^v；

(c3)由于步驟(c2)中的訓練樣本V^r主要是干擾信號，所以用步驟(c2)訓練出的字典D_v表示步驟(2)中語音信號S^r；

(c4)依據原子表示語音信號的比例，將字典D_v中的原子進行排序；

(c5)將前5％的原子組成一個新的字典D′_s，該字典組要用于提取干擾信號V^r中包含的語音信號；字典D_v中其余原子組成字典D'_v；

(c6)字典D′_s與字典D'_v進行正交，正交后的字典標記為D″_s；

(4)采用語音信號的初始相位信息恢復出頻域信號，進而對其進行反傅里葉變換，得到增強后的目標語音信號，工作過程包括如下步驟：

(d1)按照字典D″s、D'_v的原子位置，將稀疏系數X^v中相應的系數組成新的稀疏系數并標記為X^e和X^v，進而進行語音信號重構；

(d2)采用步驟(2)獲取的語音信號相位作為目標語音信號相位，進而合成出語音信號；

(d3)將(d2)中的語音信號作反離散傅里葉變換(IFFT)，將分幀的信號合成目標語音信號。

2.根據權利要求1所述的基于稀疏編碼和理想二進制掩膜相結合的語音增強方法，其特征在于：所述步驟(1)中的過程包括如下步驟：

(a1)對語音信號進行固定時長的分幀；

(a2)進行快速傅里葉變換,并保存其初始相位信息。

下載完整專利技術內容需要扣除積分，VIP會員可以免費下載。

免登錄下載普通用戶下載升級VIP會員，免費下載

該專利技術資料僅供研究查看技術是否侵權等信息，商用須獲得專利權人授權。該專利全部權利屬于河海大學常州校區，未經河海大學常州校區許可，擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作，請聯系【客服】

本文鏈接：http://www.szxzyx.cn/pat/books/201410476932.3/1.html，轉載請聲明來源鉆瓜專利網。

專利分類

專利文獻下載

說明：

1、專利原文基于中國國家知識產權局專利說明書；

2、支持發明專利、實用新型專利、外觀設計專利（升級中）；

3、專利數據每周兩次同步更新，支持Adobe PDF格式；

4、內容包括專利技術的結構示意圖、流程工藝圖或技術構造圖；

5、已全新升級為極速版,下載速度顯著提升！歡迎使用！

請您登陸后，進行下載，點擊【登陸】【注冊】