[發(fā)明專利]一種使用QR-RLS算法對(duì)多通道語音信號(hào)去混響方法在審
| 申請(qǐng)?zhí)枺?/td> | 201711353578.5 | 申請(qǐng)日: | 2017-12-15 |
| 公開(公告)號(hào): | CN108154885A | 公開(公告)日: | 2018-06-12 |
| 發(fā)明(設(shè)計(jì))人: | 孫旭光;周翊;王賢祥;黃張翼 | 申請(qǐng)(專利權(quán))人: | 重慶郵電大學(xué) |
| 主分類號(hào): | G10L21/0208 | 分類號(hào): | G10L21/0208;G10L21/0224;G10L21/0232;G10L21/0308;G10L25/21;G10L25/27 |
| 代理公司: | 北京同恒源知識(shí)產(chǎn)權(quán)代理有限公司 11275 | 代理人: | 趙榮之 |
| 地址: | 400065 *** | 國(guó)省代碼: | 重慶;50 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 混響 語音信號(hào) 多通道 短時(shí)傅里葉變換 計(jì)算期望信號(hào) 期望信號(hào)功率 信號(hào)處理技術(shù) 矩陣 功率譜密度 濾波器系數(shù) 自適應(yīng)模塊 自相關(guān)矩陣 變換信息 迭代更新 混響信號(hào) 加權(quán)系數(shù) 期望信號(hào) 輸出預(yù)測(cè) 衰減常數(shù) 延遲處理 延遲信號(hào) 范數(shù) 頻域 求逆 定性 采集 檢查 | ||
本發(fā)明涉及一種使用QR?RLS算法對(duì)多通道語音信號(hào)去混響方法,屬于信號(hào)處理技術(shù)領(lǐng)域。該方法將采集得到的帶混響語音信號(hào)進(jìn)行短時(shí)傅里葉變換,并在頻域?qū)斎胄盘?hào)進(jìn)行延遲處理,通過混響時(shí)間T60計(jì)算混響語音信號(hào)的衰減常數(shù)Δ,從而估計(jì)出晚期混響信號(hào)和期望信號(hào)的功率譜密度;然后根據(jù)得到的期望信號(hào)功率譜密度的估計(jì)值計(jì)算期望信號(hào)2范數(shù)的加權(quán)系數(shù);最后將延遲信號(hào)和帶混響語音信號(hào)作為QR?RLS算法的輸入數(shù)據(jù),對(duì)其進(jìn)行迭代更新,最后輸出預(yù)測(cè)濾波器系數(shù)。本發(fā)明有效避免了當(dāng)輸入信號(hào)不具有一致性激勵(lì)性時(shí),自相關(guān)矩陣及其對(duì)應(yīng)的求逆問題是病態(tài)的問題;使在病態(tài)環(huán)境下可以很容易的隨時(shí)檢查變換信息矩陣的正定性,從而有效提升了去混響系統(tǒng)中自適應(yīng)模塊的穩(wěn)定性。
技術(shù)領(lǐng)域
本發(fā)明屬于信號(hào)處理技術(shù)領(lǐng)域,涉及一種使用QR-RLS算法對(duì)多通道語音信號(hào)去混響方法。
背景技術(shù)
房間的混響問題嚴(yán)重的影響了語音的質(zhì)量和識(shí)別系統(tǒng)的識(shí)別率。近年來,發(fā)展出很多的去混響算法來解決這一問題,比如波束形成技術(shù)(beamforming)和房間傳輸函數(shù)的逆濾波技術(shù)等。然而這些方法需要精確的DOA(direction of arrival)估計(jì)或者房間的聲學(xué)參數(shù)等,因此,這些算法性能有限。
去混響技術(shù)可以根據(jù)是否需要對(duì)聲學(xué)沖激響應(yīng)進(jìn)行估計(jì)來分類。于是把去混響技術(shù)分為混響抑制和混響消除,前者不需要估計(jì)沖激響應(yīng),而后者需要沖激響應(yīng)的估計(jì)。混響抑制技術(shù)是基于以下假設(shè):①混響是一個(gè)加性過程,②目標(biāo)信號(hào)與混響信號(hào)不相關(guān),③混響信號(hào)模型服從正態(tài)分布。混響抑制可以繼續(xù)分為五大類,分別為:語音建模技術(shù)、線性預(yù)測(cè)殘留增強(qiáng)技術(shù)、時(shí)域包絡(luò)濾波技術(shù)、譜增強(qiáng)技術(shù)和空間處理技術(shù)。混響消除技術(shù)可以看作是沖激響應(yīng)逆濾波問題。而該技術(shù)又可以繼續(xù)分為:盲反卷積技術(shù),同態(tài)解卷積技術(shù)和基于調(diào)和的去混響技術(shù)等。
現(xiàn)階段使用比較廣泛的去混響技術(shù)就是WPE(weighted prediction error)技術(shù)。在WPE中,MCLP(multi-channel linear predictor)被用在STFT域通過混響語音的前幾幀來估計(jì)晚期混響成分。然后將混響語音與晚期混響作差,即可得到增強(qiáng)后的語音信號(hào)。該方法認(rèn)為STFT參數(shù)獨(dú)立同服從高斯分布,預(yù)測(cè)濾波器的系數(shù)在每一幀中通過最大似然估計(jì)的方法計(jì)算。
另一種基于MCLP去混響的算法是利用語音的稀疏性來實(shí)現(xiàn)的,使期望信號(hào)在STFT域的最大稀疏性達(dá)到去混響的目的。在此基礎(chǔ)上產(chǎn)生了使用RLS算法自適應(yīng)去混響的方法,但是由于RLS計(jì)算復(fù)雜度高,數(shù)值不穩(wěn)定等特性,當(dāng)房間的沖激響應(yīng)或者聲源發(fā)生移動(dòng)時(shí),去混響的效果往往不是很理想。因此,需要一種使用QR-RLS算法對(duì)語音信號(hào)去混響方法。
發(fā)明內(nèi)容
有鑒于此,本發(fā)明的目的在于提供一種使用QR-RLS算法對(duì)多通道語音信號(hào)去混響方法,采用QR-RLS算法來代替基于MCLP方法中的RLS算法,改善自適應(yīng)去混響算法在收斂速度不變的基礎(chǔ)上提高數(shù)值的穩(wěn)定性,并且避免RLS算法中的求逆運(yùn)算,使得當(dāng)房間沖激響應(yīng)或者聲源發(fā)生移動(dòng)時(shí),可以有效的提高去混響系統(tǒng)的穩(wěn)定性。
為達(dá)到上述目的,本發(fā)明提供如下技術(shù)方案,具體包括以下步驟:
步驟1:使用多個(gè)全指向性麥克風(fēng)在封閉房間內(nèi)采集帶混響的語音信號(hào);
步驟2:使用賽賓公式估計(jì)房間的混響時(shí)間T60,即直達(dá)聲聲壓級(jí)下降60dB對(duì)應(yīng)的時(shí)間,計(jì)算公式如下:
其中,α為房間吸聲系數(shù),V和S分別為房間的體積和表面積;
步驟3:將采集得到的帶混響語音信號(hào)進(jìn)行短時(shí)傅里葉變換,把信號(hào)由時(shí)域轉(zhuǎn)化為頻域,并在頻域?qū)Щ祉懻Z音信號(hào)進(jìn)行延遲處理得到延遲信號(hào),延遲信號(hào)延遲的階數(shù)由預(yù)測(cè)濾波器的長(zhǎng)度決定;
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于重慶郵電大學(xué),未經(jīng)重慶郵電大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201711353578.5/2.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 信息處理設(shè)備、方法和記錄媒體
- 語音信號(hào)處理電路和裝置
- 一種判斷說話人數(shù)目的方法及系統(tǒng)
- 基于人工智能的語音信號(hào)處理方法、裝置及存儲(chǔ)介質(zhì)
- 環(huán)境語音采集處理方法、裝置、設(shè)備及可讀存儲(chǔ)介質(zhì)
- 語音識(shí)別方法、裝置、電子設(shè)備以及存儲(chǔ)介質(zhì)
- 語音信號(hào)的處理方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 語音信號(hào)處理方法、裝置、電子設(shè)備和存儲(chǔ)介質(zhì)
- 一種語音信號(hào)處理方法、裝置、介質(zhì)和設(shè)備
- 一種雙路語音同傳的收發(fā)系統(tǒng)
- 濾波器系數(shù)群計(jì)算設(shè)備以及濾波器系數(shù)群計(jì)算方法
- 一種低信噪比下LFM信號(hào)的檢測(cè)方法
- 一種基于同步壓縮變換重構(gòu)的幅值校正方法
- 基于短時(shí)傅里葉變換的隔墻人體運(yùn)動(dòng)檢測(cè)方法
- 基于短時(shí)傅里葉變換的油井動(dòng)液面深度檢測(cè)方法
- 一種基于逆短時(shí)傅里葉變換的軸流風(fēng)機(jī)振動(dòng)信號(hào)子成分提取方法
- 一種基于深度學(xué)習(xí)的單通道語音分離方法
- 擠壓短時(shí)傅里葉變換的地震勘探信號(hào)隨機(jī)噪聲壓制方法
- 一種基于非線性時(shí)間擠壓時(shí)頻變換的瞬態(tài)弱信號(hào)檢測(cè)方法
- 一種基于深度學(xué)習(xí)的空中管制語音降噪方法





