[發明專利]一種基于計算聽覺場景分析的單通道語音盲分離方法有效
| 申請號: | 201310384413.X | 申請日: | 2013-08-29 |
| 公開(公告)號: | CN103456312A | 公開(公告)日: | 2013-12-18 |
| 發明(設計)人: | 李鴻燕;賈海蓉;張雪英;任光龍;屈俊玲 | 申請(專利權)人: | 太原理工大學 |
| 主分類號: | G10L21/0272 | 分類號: | G10L21/0272 |
| 代理公司: | 北京方圓嘉禾知識產權代理有限公司 11385 | 代理人: | 董芙蓉 |
| 地址: | 030024 山西省太原*** | 國省代碼: | 山西;14 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 計算 聽覺 場景 分析 通道 語音 分離 方法 | ||
1.一種基于計算聽覺場景分析的單通道語音盲分離方法,其特征在于:
所述方法包括如下步驟:
步驟一、對輸入的混疊語音進行前端處理;
步驟二、對經過步驟一處理的混疊語音進行聽覺特征提??;
步驟三、對經過步驟二處理的混疊語音基于諧波特性進行聽覺分割;
步驟四、對經過步驟三處理的混疊語音基于能量特征進行聽覺重組;
步驟五、對經過步驟四處理的混疊語音進行目標語音重構。
2.如權利要求1所述的一種基于計算聽覺場景分析的單通道語音盲分離方法,其特征在于:
步驟一中:所述前端處理是將輸入的混合時域信號轉化成相應的時頻域表示形式;根據人耳的感知機理,將輸入混合聲音信號通過128個信道的Gammatone濾波器組進行帶通濾波,該濾波器的中心頻率按照等距寬(Equivalent?Rectangular?Bandwidth,ERB)在80~5kHz之間準對數分布;將時頻分解后的每一個Gammatone濾波器的輸出送入Meddis內耳毛細胞模型;得到神經發放率;然后,在時域上對每個毛細胞的輸出以幀長20ms,50%重疊為幀移進行分幀處理;將輸入的混合語音信號分解成為一系列時頻單元,即T-F單元;同時,為了高頻部分的特征提取和聽覺重組,對毛細胞輸出進行半波整流和低通濾波,從而得到每個通道的包絡特征。
3.如權利要求1或2所述的一種基于計算聽覺場景分析的單通道語音盲分離方法,其特征在于:
步驟二中:經過前端處理過程,混合語音信號在時域和頻域上被分解成一系列的T-F單元,在每個T-F單元中,計算下列特征函數:自相關函數(AH)、包絡自相關函數(AE)、主基音周期(P(m))、相鄰信道互相關(CH)、相鄰信道包絡互相關(CE),式(4)、式(5)、式(6)、式(7、式(8)為其計算公式:
其中,c表示信道,m為時間幀,Nc是采樣點數,h(c,·)表示神經發放率,時延τ∈[0,12.5ms],表示幀移,hE(c,·)為毛細胞輸出包絡;
其中,L=采樣率×12.5ms,表示歸一化的自相關函數,表示歸一化的包絡自相關函數。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于太原理工大學,未經太原理工大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201310384413.X/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:抗干擾變頻器電纜
- 下一篇:一種具有隔熱功能的五層復合吸聲材料





