[發(fā)明專(zhuān)利]強(qiáng)魯棒性語(yǔ)音分離方法無(wú)效
| 申請(qǐng)?zhí)枺?/td> | 200710024894.8 | 申請(qǐng)日: | 2007-07-05 |
| 公開(kāi)(公告)號(hào): | CN101083078A | 公開(kāi)(公告)日: | 2007-12-05 |
| 發(fā)明(設(shè)計(jì))人: | 褚軼景;丁和平;邱小軍 | 申請(qǐng)(專(zhuān)利權(quán))人: | 南京大學(xué);加拿大國(guó)家研究委員會(huì) |
| 主分類(lèi)號(hào): | G10L21/02 | 分類(lèi)號(hào): | G10L21/02 |
| 代理公司: | 南京天翼專(zhuān)利代理有限責(zé)任公司 | 代理人: | 湯志武;王鵬翔 |
| 地址: | 210093*** | 國(guó)省代碼: | 江蘇;32 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 強(qiáng)魯棒性 語(yǔ)音 分離 方法 | ||
一、技術(shù)領(lǐng)域
本發(fā)明涉及一種實(shí)現(xiàn)兩混合語(yǔ)音分離而魯棒性較強(qiáng)的方法。
二、背景技術(shù)
雞尾酒會(huì)效應(yīng)通常會(huì)影響語(yǔ)音質(zhì)量。如何將兩個(gè)不同方向傳來(lái)的混合語(yǔ)音分離,現(xiàn)有的解決辦法是1)使用揚(yáng)聲器陣列實(shí)現(xiàn)波達(dá)方向(DOA)識(shí)別技術(shù)及2)基于獨(dú)立分量分析(ICA)的盲分離技術(shù)。陣列方法主瓣寬度難以做到很窄,旁瓣難以抑制;盲分離技術(shù)則要求信號(hào)互不相關(guān),這使得此技術(shù)的實(shí)際應(yīng)用受阻。
中國(guó)專(zhuān)利公開(kāi)CN00804884.3用于語(yǔ)音識(shí)別的聲調(diào)特性,(皇家菲利浦電子有限公司)增強(qiáng)的聲音聲調(diào)特性首先通過(guò)引入帶有自適應(yīng)切除的在線(xiàn)的先行追溯基頻(FO)輪廓而得到,這個(gè)基頻用作為信號(hào)預(yù)處理前端。FO輪廓隨后借助于時(shí)變的加權(quán)移動(dòng)平均(MA)濾波器并結(jié)合FO輪廓的加權(quán)的(更多地關(guān)注元音)最小平方而被分解為詞匯聲調(diào)影響、詞組語(yǔ)調(diào)影響、和隨機(jī)影響。詞組語(yǔ)調(diào)影響被定義為發(fā)聲的FO輪廓的長(zhǎng)期趨勢(shì),它可用FO輪廓的加權(quán)移動(dòng)平均來(lái)近似,而其加權(quán)值與信號(hào)的周期性程度有關(guān)。
CN200510067777.0利用中樞網(wǎng)絡(luò)分離語(yǔ)音信號(hào),它能夠分離和重建在語(yǔ)音信號(hào)的頻率成分被背景噪聲掩蓋的環(huán)境中傳輸?shù)恼Z(yǔ)音信號(hào)。該語(yǔ)音分離系統(tǒng)從一個(gè)音頻源獲得一個(gè)伴有噪聲的語(yǔ)音信號(hào)。然后噪聲語(yǔ)音信號(hào)可通過(guò)一個(gè)已訓(xùn)練為能夠從背景噪聲中隔離和重建純凈語(yǔ)音信號(hào)的中樞網(wǎng)絡(luò)進(jìn)行饋送。一旦噪聲語(yǔ)音信號(hào)通過(guò)中樞網(wǎng)絡(luò)進(jìn)行饋送,該語(yǔ)音信號(hào)分離系統(tǒng)就產(chǎn)生一個(gè)充分降噪的估值語(yǔ)音信號(hào)。
CN00815076.1語(yǔ)音識(shí)別的健壯特征提取方法和裝置,涉及一種在有噪聲環(huán)境下用于語(yǔ)音識(shí)別的健壯(robust)特征提取方法和裝置,在其中按頻譜分量的特征對(duì)一個(gè)語(yǔ)音信號(hào)分段。將語(yǔ)音信號(hào)劃分成L次能帶中的許多短期頻譜分量,其中的L=1,2,...,并且根據(jù)僅含噪聲的片段估算一個(gè)噪聲頻譜。然后根據(jù)對(duì)應(yīng)的短期頻譜執(zhí)行對(duì)估算的噪聲頻譜的頻譜減法,并且為各個(gè)短期頻譜分量計(jì)算出含噪聲的概率。最后為含語(yǔ)音的概率很低的各短期頻譜的這些頻譜分量執(zhí)行內(nèi)插,以便平滑那些僅含噪聲的短期頻譜。通過(guò)對(duì)含噪聲的頻譜分量執(zhí)行內(nèi)插就能從近旁找到可靠的頻譜語(yǔ)音分量。
但現(xiàn)有技術(shù)未涉及混合語(yǔ)音分離過(guò)濾,尤其是魯棒性高,計(jì)算量較小的語(yǔ)音分離方法并未作為專(zhuān)利提出。
如圖1,假設(shè)房間中有兩個(gè)聲源發(fā)出音頻信號(hào)(s1和s2),同時(shí)有兩個(gè)麥克風(fēng)對(duì)信號(hào)采樣(x1和x2)。如果兩聲源同時(shí)發(fā)聲,s1和s2通過(guò)房間固有的傳遞函數(shù)Hij,i,j=1,2混合,麥克風(fēng)將會(huì)得到混合語(yǔ)音。
三、發(fā)明內(nèi)容
本發(fā)明的目的是提供一種魯棒性高,計(jì)算量較小的語(yǔ)音分離算法。該方法假設(shè)聲源存在足夠長(zhǎng)的單聲源作用時(shí)段,采用簡(jiǎn)單的單聲源作用時(shí)段檢測(cè)方法,在單聲源作用時(shí)段實(shí)現(xiàn)分離濾波器估計(jì),兩聲源同時(shí)作用時(shí)段進(jìn)行混合語(yǔ)音分離。
本發(fā)明是通過(guò)以下技術(shù)方案來(lái)實(shí)現(xiàn)的:
強(qiáng)魯棒性語(yǔ)音分離方法,采用兩路麥克風(fēng)接收信號(hào)x1和x2,且每路信號(hào)分別聯(lián)接分離濾波器Wij(n),i,j=1,2(如圖1),同時(shí)x1和x2分別聯(lián)接檢測(cè)濾波器Di(n),i=1,2(如圖2),使用單聲源作用檢測(cè)方法檢測(cè)出單聲源作用時(shí)段后,再進(jìn)行分離濾波器估計(jì),這樣,兩聲源同時(shí)作用時(shí)就可以進(jìn)行混合語(yǔ)音分離;本發(fā)明提供一種魯棒性較強(qiáng)的方法,可以實(shí)現(xiàn)混合語(yǔ)音的分離,在系統(tǒng)輸出分別得到s1和s2還原后的信號(hào)u1和u2。方法的關(guān)鍵在于假設(shè)聲源存在足夠長(zhǎng)的單聲源作用時(shí)段(即只有si,i=1或2,作用的時(shí)段),此時(shí)x1、x2分別為
該專(zhuān)利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專(zhuān)利權(quán)人授權(quán)。該專(zhuān)利全部權(quán)利屬于南京大學(xué);加拿大國(guó)家研究委員會(huì),未經(jīng)南京大學(xué);加拿大國(guó)家研究委員會(huì)許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買(mǎi)此專(zhuān)利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/200710024894.8/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專(zhuān)利網(wǎng)。
- 上一篇:親水性聚合物磁性微球及其制備方法和用途
- 下一篇:擠出涂覆聚乙烯
- 同類(lèi)專(zhuān)利
- 專(zhuān)利分類(lèi)
G10L 語(yǔ)音分析或合成;語(yǔ)音識(shí)別;音頻分析或處理
G10L21-00 為了改變語(yǔ)音信號(hào)的質(zhì)量或其可識(shí)度而處理語(yǔ)音信號(hào),以產(chǎn)生另一種可聽(tīng)的或非可聽(tīng)的信號(hào),例如視覺(jué)信號(hào)或觸覺(jué)信號(hào)
G10L21-02 .語(yǔ)音增強(qiáng),例如降低噪聲或消除回聲
G10L21-04 .時(shí)間壓縮或擴(kuò)展
G10L21-06 .將語(yǔ)音轉(zhuǎn)換成非可聽(tīng)表達(dá)形式,例如語(yǔ)音可視化、觸覺(jué)輔助的語(yǔ)音處理
- 強(qiáng)魯棒性語(yǔ)音分離方法
- 一種用于磁共振成像超導(dǎo)磁體設(shè)計(jì)的離散優(yōu)化方法
- 一種具有強(qiáng)魯棒性的雙重變換域圖像零水印方法
- 強(qiáng)魯棒性QR碼水印算法
- 針對(duì)射程不確定性的質(zhì)子重離子調(diào)強(qiáng)放療魯棒優(yōu)化方法
- 一種交直流混聯(lián)微網(wǎng)的隨機(jī)魯棒耦合型優(yōu)化調(diào)度方法
- 一種基于魯棒卡爾曼濾波的抗欺騙干擾組合導(dǎo)航方法
- 一種無(wú)人飛行器魯棒H∞降階控制方法
- 基于矩陣奇異值分解的四元數(shù)彩色數(shù)字圖像盲水印方法
- 基于純四元數(shù)Schur分解的彩色數(shù)字圖像盲水印方法
- 用于語(yǔ)音處理的方法與系統(tǒng)
- 一種語(yǔ)音識(shí)別測(cè)試系統(tǒng)及方法
- 用于語(yǔ)音識(shí)別的方法和裝置
- 一種語(yǔ)音消毒柜的控制方法及語(yǔ)音消毒柜
- 一種語(yǔ)音處理方法及裝置
- 混合語(yǔ)音識(shí)別方法、裝置及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)
- 語(yǔ)音情緒識(shí)別方法、系統(tǒng)、移動(dòng)終端及存儲(chǔ)介質(zhì)
- 一種具有語(yǔ)音識(shí)別功能的智能語(yǔ)音終端設(shè)備
- 語(yǔ)音增強(qiáng)方法、裝置、電子設(shè)備和存儲(chǔ)介質(zhì)
- 一種聲紋鑒定語(yǔ)音重組方法和系統(tǒng)
- 一種數(shù)據(jù)庫(kù)讀寫(xiě)分離的方法和裝置
- 一種手機(jī)動(dòng)漫人物及背景創(chuàng)作方法
- 一種通訊綜合測(cè)試終端的測(cè)試方法
- 一種服裝用人體測(cè)量基準(zhǔn)點(diǎn)的獲取方法
- 系統(tǒng)升級(jí)方法及裝置
- 用于虛擬和接口方法調(diào)用的裝置和方法
- 線(xiàn)程狀態(tài)監(jiān)控方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)
- 一種JAVA智能卡及其虛擬機(jī)組件優(yōu)化方法
- 檢測(cè)程序中方法耗時(shí)的方法、裝置及存儲(chǔ)介質(zhì)
- 函數(shù)的執(zhí)行方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)





