[發(fā)明專利]強(qiáng)魯棒性語音分離方法無效
| 申請?zhí)枺?/td> | 200710024894.8 | 申請日: | 2007-07-05 |
| 公開(公告)號: | CN101083078A | 公開(公告)日: | 2007-12-05 |
| 發(fā)明(設(shè)計(jì))人: | 褚軼景;丁和平;邱小軍 | 申請(專利權(quán))人: | 南京大學(xué);加拿大國家研究委員會(huì) |
| 主分類號: | G10L21/02 | 分類號: | G10L21/02 |
| 代理公司: | 南京天翼專利代理有限責(zé)任公司 | 代理人: | 湯志武;王鵬翔 |
| 地址: | 210093*** | 國省代碼: | 江蘇;32 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 強(qiáng)魯棒性 語音 分離 方法 | ||
一、技術(shù)領(lǐng)域
本發(fā)明涉及一種實(shí)現(xiàn)兩混合語音分離而魯棒性較強(qiáng)的方法。
二、背景技術(shù)
雞尾酒會(huì)效應(yīng)通常會(huì)影響語音質(zhì)量。如何將兩個(gè)不同方向傳來的混合語音分離,現(xiàn)有的解決辦法是1)使用揚(yáng)聲器陣列實(shí)現(xiàn)波達(dá)方向(DOA)識別技術(shù)及2)基于獨(dú)立分量分析(ICA)的盲分離技術(shù)。陣列方法主瓣寬度難以做到很窄,旁瓣難以抑制;盲分離技術(shù)則要求信號互不相關(guān),這使得此技術(shù)的實(shí)際應(yīng)用受阻。
中國專利公開CN00804884.3用于語音識別的聲調(diào)特性,(皇家菲利浦電子有限公司)增強(qiáng)的聲音聲調(diào)特性首先通過引入帶有自適應(yīng)切除的在線的先行追溯基頻(FO)輪廓而得到,這個(gè)基頻用作為信號預(yù)處理前端。FO輪廓隨后借助于時(shí)變的加權(quán)移動(dòng)平均(MA)濾波器并結(jié)合FO輪廓的加權(quán)的(更多地關(guān)注元音)最小平方而被分解為詞匯聲調(diào)影響、詞組語調(diào)影響、和隨機(jī)影響。詞組語調(diào)影響被定義為發(fā)聲的FO輪廓的長期趨勢,它可用FO輪廓的加權(quán)移動(dòng)平均來近似,而其加權(quán)值與信號的周期性程度有關(guān)。
CN200510067777.0利用中樞網(wǎng)絡(luò)分離語音信號,它能夠分離和重建在語音信號的頻率成分被背景噪聲掩蓋的環(huán)境中傳輸?shù)恼Z音信號。該語音分離系統(tǒng)從一個(gè)音頻源獲得一個(gè)伴有噪聲的語音信號。然后噪聲語音信號可通過一個(gè)已訓(xùn)練為能夠從背景噪聲中隔離和重建純凈語音信號的中樞網(wǎng)絡(luò)進(jìn)行饋送。一旦噪聲語音信號通過中樞網(wǎng)絡(luò)進(jìn)行饋送,該語音信號分離系統(tǒng)就產(chǎn)生一個(gè)充分降噪的估值語音信號。
CN00815076.1語音識別的健壯特征提取方法和裝置,涉及一種在有噪聲環(huán)境下用于語音識別的健壯(robust)特征提取方法和裝置,在其中按頻譜分量的特征對一個(gè)語音信號分段。將語音信號劃分成L次能帶中的許多短期頻譜分量,其中的L=1,2,...,并且根據(jù)僅含噪聲的片段估算一個(gè)噪聲頻譜。然后根據(jù)對應(yīng)的短期頻譜執(zhí)行對估算的噪聲頻譜的頻譜減法,并且為各個(gè)短期頻譜分量計(jì)算出含噪聲的概率。最后為含語音的概率很低的各短期頻譜的這些頻譜分量執(zhí)行內(nèi)插,以便平滑那些僅含噪聲的短期頻譜。通過對含噪聲的頻譜分量執(zhí)行內(nèi)插就能從近旁找到可靠的頻譜語音分量。
但現(xiàn)有技術(shù)未涉及混合語音分離過濾,尤其是魯棒性高,計(jì)算量較小的語音分離方法并未作為專利提出。
如圖1,假設(shè)房間中有兩個(gè)聲源發(fā)出音頻信號(s1和s2),同時(shí)有兩個(gè)麥克風(fēng)對信號采樣(x1和x2)。如果兩聲源同時(shí)發(fā)聲,s1和s2通過房間固有的傳遞函數(shù)Hij,i,j=1,2混合,麥克風(fēng)將會(huì)得到混合語音。
三、發(fā)明內(nèi)容
本發(fā)明的目的是提供一種魯棒性高,計(jì)算量較小的語音分離算法。該方法假設(shè)聲源存在足夠長的單聲源作用時(shí)段,采用簡單的單聲源作用時(shí)段檢測方法,在單聲源作用時(shí)段實(shí)現(xiàn)分離濾波器估計(jì),兩聲源同時(shí)作用時(shí)段進(jìn)行混合語音分離。
本發(fā)明是通過以下技術(shù)方案來實(shí)現(xiàn)的:
強(qiáng)魯棒性語音分離方法,采用兩路麥克風(fēng)接收信號x1和x2,且每路信號分別聯(lián)接分離濾波器Wij(n),i,j=1,2(如圖1),同時(shí)x1和x2分別聯(lián)接檢測濾波器Di(n),i=1,2(如圖2),使用單聲源作用檢測方法檢測出單聲源作用時(shí)段后,再進(jìn)行分離濾波器估計(jì),這樣,兩聲源同時(shí)作用時(shí)就可以進(jìn)行混合語音分離;本發(fā)明提供一種魯棒性較強(qiáng)的方法,可以實(shí)現(xiàn)混合語音的分離,在系統(tǒng)輸出分別得到s1和s2還原后的信號u1和u2。方法的關(guān)鍵在于假設(shè)聲源存在足夠長的單聲源作用時(shí)段(即只有si,i=1或2,作用的時(shí)段),此時(shí)x1、x2分別為
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于南京大學(xué);加拿大國家研究委員會(huì),未經(jīng)南京大學(xué);加拿大國家研究委員會(huì)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/200710024894.8/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 上一篇:親水性聚合物磁性微球及其制備方法和用途
- 下一篇:擠出涂覆聚乙烯
- 強(qiáng)魯棒性語音分離方法
- 一種用于磁共振成像超導(dǎo)磁體設(shè)計(jì)的離散優(yōu)化方法
- 一種具有強(qiáng)魯棒性的雙重變換域圖像零水印方法
- 強(qiáng)魯棒性QR碼水印算法
- 針對射程不確定性的質(zhì)子重離子調(diào)強(qiáng)放療魯棒優(yōu)化方法
- 一種交直流混聯(lián)微網(wǎng)的隨機(jī)魯棒耦合型優(yōu)化調(diào)度方法
- 一種基于魯棒卡爾曼濾波的抗欺騙干擾組合導(dǎo)航方法
- 一種無人飛行器魯棒H∞降階控制方法
- 基于矩陣奇異值分解的四元數(shù)彩色數(shù)字圖像盲水印方法
- 基于純四元數(shù)Schur分解的彩色數(shù)字圖像盲水印方法





