[發明專利]基于稀疏編碼和理想二進制掩膜相結合的語音增強方法有效
| 申請號: | 201410476932.3 | 申請日: | 2014-09-17 |
| 公開(公告)號: | CN104240717B | 公開(公告)日: | 2017-04-26 |
| 發明(設計)人: | 湯一彬;談雅文;李旭斐;蔣愛民;徐寧;殷澄 | 申請(專利權)人: | 河海大學常州校區 |
| 主分類號: | G10L21/0208 | 分類號: | G10L21/0208 |
| 代理公司: | 南京縱橫知識產權代理有限公司32224 | 代理人: | 董建林 |
| 地址: | 213022 *** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 稀疏 編碼 理想 二進制 相結合 語音 增強 方法 | ||
1.一種基于稀疏編碼和理想二進制掩膜相結合的語音增強方法,其特征在于:首先利用理想的二進制掩膜算法對信號功率譜進行初步降噪處理;其次通過稀疏編碼對處理后的信號做進一步處理,從而實現語音增強的效果,具體包含以下步驟:
(1)將時域信號轉換為頻域信號;
(2)采用理想二進制掩膜算法對語音信號功率譜進行初步降噪處理,包括如下步驟:
(b1)根據語音信號受污染的程度,選定一個閾值;
(b2)計算出每一個時頻點的信噪比,若該時頻點的信噪比大于選定的閾值,則掩膜中相應位置的元素為1;反之,該元素為0;
(b3)將時頻信號和掩膜進行點乘,即可得到經過理想二進制掩膜算法初步處理后的語音信號Sr;(b4)將時頻信號和掩膜的邏輯逆矩陣進行點乘,即可得到在IBM算法中被認為是噪聲的干擾信號Vr;
(3)利用稀疏編碼理論對初步處理后的信號作進一步降噪處理,同時從被認為是干擾信號中提取有效的語音成分,工作過程包括如下步驟:
(c1)根據稀疏理論,將步驟(b3)中初步處理后的語音信號Sr作訓練樣本,采用K-SVD算法訓練出語音信號字典Ds以及相對應的稀疏系數Xe;
(c2)根據稀疏理論,將步驟(b4)中的干擾信號Vr作訓練樣本,同樣采用K-SVD算法訓練出干擾信號字典Dv以及采用正交匹配算法計算出該字典相應的稀疏系數Xv;
(c3)由于步驟(c2)中的訓練樣本Vr主要是干擾信號,所以用步驟(c2)訓練出的字典Dv表示步驟(2)中語音信號Sr;
(c4)依據原子表示語音信號的比例,將字典Dv中的原子進行排序;
(c5)將前5%的原子組成一個新的字典D′s,該字典組要用于提取干擾信號Vr中包含的語音信號;字典Dv中其余原子組成字典D'v;
(c6)字典D′s與字典D'v進行正交,正交后的字典標記為D″s;
(4)采用語音信號的初始相位信息恢復出頻域信號,進而對其進行反傅里葉變換,得到增強后的目標語音信號,工作過程包括如下步驟:
(d1)按照字典D″s、D'v的原子位置,將稀疏系數Xv中相應的系數組成新的稀疏系數并標記為Xe和Xv,進而進行語音信號重構;
(d2)采用步驟(2)獲取的語音信號相位作為目標語音信號相位,進而合成出語音信號;
(d3)將(d2)中的語音信號作反離散傅里葉變換(IFFT),將分幀的信號合成目標語音信號。
2.根據權利要求1所述的基于稀疏編碼和理想二進制掩膜相結合的語音增強方法,其特征在于:所述步驟(1)中的過程包括如下步驟:
(a1)對語音信號進行固定時長的分幀;
(a2)進行快速傅里葉變換,并保存其初始相位信息。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于河海大學常州校區,未經河海大學常州校區許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201410476932.3/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種腎穿刺后醫用護理衣
- 下一篇:子宮內膜細胞采集器





