[發明專利]卷積語音信號的頻域盲分離排序算法無效
| 申請號: | 201110117022.2 | 申請日: | 2011-05-06 |
| 公開(公告)號: | CN102231280A | 公開(公告)日: | 2011-11-02 |
| 發明(設計)人: | 劉琚;王倩;杜軍;劉朝晨;呂寧 | 申請(專利權)人: | 山東大學 |
| 主分類號: | G10L21/02 | 分類號: | G10L21/02;G10L15/22;G06F17/15 |
| 代理公司: | 濟南金迪知識產權代理有限公司 37219 | 代理人: | 寧欽亮 |
| 地址: | 250100 山*** | 國省代碼: | 山東;37 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 卷積 語音 信號 頻域盲 分離 排序 算法 | ||
技術領域
本發明涉及一種解決卷積混合語音信號在頻域盲源分離過程中存在的次序不確定性問題的方法,屬于語音信號處理領域。
背景技術
盲分離算法是在源信號和混合過程未知的情況下,從觀測的混合信號中估計出原始信號的方法。盲分離算法廣泛應用于語音信號處理、無線通信、醫學信號處理等多個領域。針對卷積盲分離問題,目前主要存在兩類算法:第一類是時域分離算法,第二類是頻域分離算法。頻域語音信號盲分離算法相對于時域盲源分離算法來說,因其較小的計算量和良好的分離性能而受到研究人員的關注。但是頻域分離算法也存在兩個問題:一個是幅值不確定性,一個是次序不確定性。其中次序不確定性對卷積混合頻域盲分離算法的影響非常大,可以說它是卷積混合頻域盲分離算法成功與否的最關鍵因素,也是當前卷積盲分離研究的熱點之一。因為次序不確定性會使相鄰頻帶上分離出來的信號連接錯誤,最終導致分離失敗。
目前解決頻域盲分離次序不確定問題的方法主要有兩大類:第一類是基于到達角估計(DOA)的排序方法,第二類是基于頻帶間相關性的排序方法。這兩類排序算法的優缺點:
(1)基于DOA的排序算法具有很好的魯棒性,因為在一個頻帶上的不對準不會影響其他頻帶;但是該算法準確性較差,計算量大。
(2)基于頻帶間相關性的排序算法具有較好的準確性,但是魯棒性較差,因為在一個頻帶上的不對準會導致連續頻帶上的排序發生錯誤。
發明內容
本發明針對現有解決卷積頻域盲分離中存在的次序不確定性問題的方法所存在的不足,提出一種具有較好的魯棒性和準確性的卷積語音信號的頻域盲分離排序算法。
本發明的卷積語音信號的頻域盲分離排序算法,使用卷積混疊模型,對于卷積混疊語音信號,首先由時域轉換到頻域,在每個頻帶上使用頻域ICA算法進行盲分離,然后按以下步驟進行排序,實現每個頻帶的對準:
(1)基準頻帶的對準:選取基準頻帶進行對準,在所有頻帶中選取基準頻帶,根據對于同一個語音信號在不同頻帶上能量隨時間呈現相似的變化這一特點對基準頻帶進行排序;
(2)剩余頻帶的對準:根據已排序好的基準頻帶對剩余頻帶進行排序,每個剩余頻帶都有對應的基準頻帶,對應的基準頻帶是指距離該剩余頻帶最近的基準頻帶,利用已排序好的基準頻帶,根據同一語音信號在相鄰頻帶上的幅度相關性這一特點,對每個剩余頻帶進行排序;
(3)補充性對準:標記可能出現排序錯誤的頻帶,利用基于分離矩陣的DOA估計進行補充性對準,對步驟(2)中可能出現對準錯誤的頻帶用基于到達角估計(DOA)的排序方法進行重新排序。
所述步驟(1)的具體實現步驟為:
A.選取基準頻帶,假設相鄰基準頻帶間隔偶數個頻帶;
B.計算每個基準頻帶上的能量輪廓,遍歷所有可能的排序,最終找到使目標函數最小化的排序即為最終的排序。
所述步驟(2)的具體實現步驟為:
A.根據分離矩陣計算每個頻帶上分離出來的信號;
B.計算每個剩余頻帶與對應的基準頻帶上分離信號的幅度相關性;
C.遍歷所有可能的排序,找到幅度相關性最大的排序即為最終的排序。
所述步驟(3)的具體實現步驟為:
A.若在步驟(2)中對于不同的排序,個別頻帶上幅度相關性相差不大,則這些頻帶上有可能出現排序錯誤,對這些頻帶進行標記;
B.對標記的頻帶進行基于分離矩陣的DOA估計;
C.對估計出的DOA進行聚類,即找到分離矩陣相應的排序。
上述算法中第(1)步和第(2)步利用了基于頻帶相關性的排序算法的準確性高的優點,同時通過基準頻帶的選取在一定程度上克服了其魯棒性差的缺點。第(3)步利用了基于DOA的排序算法魯棒性高的優點來進行補充性對準,同時由于步驟三中所需對準的頻帶數很少,不會過多增加整個排序算法的計算復雜度。
本發明采用基準頻帶的思想并結合了現有的基于頻帶間相關性和基于到達角估計(DOA)這兩類主要排序算法的優勢,具有很好的魯棒性和準確性。
附圖說明
圖1是頻域盲分離流程框圖。
圖2是原始語音信號圖。
圖3是未排序的全局濾波器W(t)*H(t)的沖激響應圖。
圖4是本發明排序后的全局濾波器W(t)*H(t)的沖激響應圖。
圖5是經過每一步排序后的NRR比較圖。
圖6是真實環境下語音采集的房間布局示意圖。
圖7是真實環境下觀測信號、估計信號和真實源信號圖。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于山東大學,未經山東大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201110117022.2/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:雙向錐體光纖微小粒子旋轉器
- 下一篇:一種頂格練字方法





