[發(fā)明專利]基于改進(jìn)的Mel頻率尺度和相位修正的耳語(yǔ)音增強(qiáng)算法在審
| 申請(qǐng)?zhí)枺?/td> | 201910146887.8 | 申請(qǐng)日: | 2019-02-27 |
| 公開(公告)號(hào): | CN109712638A | 公開(公告)日: | 2019-05-03 |
| 發(fā)明(設(shè)計(jì))人: | 李晨;韋怡;曾毓敏;李天峰 | 申請(qǐng)(專利權(quán))人: | 南京師范大學(xué) |
| 主分類號(hào): | G10L21/0232 | 分類號(hào): | G10L21/0232;G10L21/0208 |
| 代理公司: | 北京盛凡智榮知識(shí)產(chǎn)權(quán)代理有限公司 11616 | 代理人: | 梁永昌 |
| 地址: | 210023 江蘇省南京*** | 國(guó)省代碼: | 江蘇;32 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 耳語(yǔ)音 算法 頻率尺度 噪聲估計(jì) 尺度 補(bǔ)償相位 相位修正 頻譜 改進(jìn) 主觀聽力測(cè)試 共振峰頻率 客觀評(píng)價(jià) 聽覺模型 正常語(yǔ)音 相位譜 減去 合成 研究 | ||
本發(fā)明公開了基于改進(jìn)的Mel頻率尺度和相位修正的耳語(yǔ)音增強(qiáng)算法:根據(jù)耳語(yǔ)音的特點(diǎn),對(duì)正常語(yǔ)音的標(biāo)準(zhǔn)Mel頻帶進(jìn)行了重新劃分,在研究耳語(yǔ)音的共振峰頻率和能量以及耳語(yǔ)音聽覺模型的基礎(chǔ)上,提出了一種其改進(jìn)的Mel頻率尺度(稱為Mel_m尺度),在此基礎(chǔ)上,對(duì)Mel_m尺度進(jìn)行了改進(jìn)并針對(duì)耳語(yǔ)音提出了一種新的尺度劃分方法,稱為Mel_improved尺度;本發(fā)明將譜減后的耳語(yǔ)音頻譜與改變后的相位譜相結(jié)合來合成新的增強(qiáng)后的耳語(yǔ)音信號(hào)。補(bǔ)償相位中的噪聲估計(jì)值是通過使用補(bǔ)償相位來獲得初級(jí)增強(qiáng)耳語(yǔ)音信號(hào),然后從含噪的耳語(yǔ)音頻譜中減去噪聲估計(jì)值來獲得新的噪聲估計(jì)譜。語(yǔ)譜圖、客觀評(píng)價(jià)和主觀聽力測(cè)試的實(shí)驗(yàn)結(jié)果表明,提出的耳語(yǔ)音增強(qiáng)算法優(yōu)于同類可比較的其他耳語(yǔ)音增強(qiáng)算法。
技術(shù)領(lǐng)域
本發(fā)明涉及Mel頻率尺度與耳語(yǔ)音增強(qiáng)算法領(lǐng)域,特別涉及基于改進(jìn)的Mel頻率尺度和相位修正的耳語(yǔ)音增強(qiáng)算法。
背景技術(shù)
耳語(yǔ)音是人類交流過程中一種自然但又特殊的語(yǔ)言形式。耳語(yǔ)被定義為輕聲說話但聲帶不振動(dòng)以避免被偷聽到的講話方式。在許多公共場(chǎng)所,用耳語(yǔ)音進(jìn)行交流是非常有必要的,如圖書館或會(huì)議廳等。
耳語(yǔ)音的發(fā)聲機(jī)制與正常語(yǔ)音不同。第一個(gè)不同之處在于,當(dāng)耳語(yǔ)音發(fā)音時(shí),聲帶沒有振動(dòng),這點(diǎn)與噪聲激勵(lì)有點(diǎn)相似。第二個(gè)區(qū)別是氣管和聲道由于聲帶打開而耦合。正是由于這兩個(gè)特點(diǎn),尤其在嘈雜的環(huán)境中耳語(yǔ)音比正常語(yǔ)音更難檢測(cè)。與正常語(yǔ)音相比,耳語(yǔ)音的第一共振峰頻率向更高頻率移動(dòng)。同時(shí),根據(jù)Sahar和John的研究表明,人耳對(duì)耳語(yǔ)音的敏感區(qū)域在第二共振峰頻率附近,而不是在第一共振峰頻率附近。
目前,耳語(yǔ)音在國(guó)內(nèi)外是比較新的研究課題,還處于研究初期。考慮到耳語(yǔ)音和正常語(yǔ)音之間聲學(xué)特性的差異,常規(guī)的語(yǔ)音增強(qiáng)方法并不適用于耳語(yǔ)音增強(qiáng)。但是,在一定程度上,可以在語(yǔ)音增強(qiáng)算法的基礎(chǔ)上對(duì)耳語(yǔ)音增強(qiáng)有一定的理論幫助。
眾所周知,人耳感知的靈敏度在頻譜中是呈非線性變化的。從Fletcher的實(shí)驗(yàn)研究中可以得出結(jié)論,外圍聽覺系統(tǒng)的行為好像包含一組帶通濾波器,具有重疊的通帶。人耳基底膜上的每個(gè)位置對(duì)有限的頻率范圍做出響應(yīng),因此每個(gè)不同點(diǎn)對(duì)應(yīng)于具有不同中心頻率的濾波器。因此,臨界頻帶的概念對(duì)于描述聽覺感知具有重要意義。雖然Mel頻率映射函數(shù)在正常語(yǔ)音增強(qiáng)中是有效的,但是它并不適合于耳語(yǔ)音增強(qiáng)。從以下方面可以看出(如圖1):(1)由于正常語(yǔ)音的第一共振峰在能量集中區(qū)域附近,所以Mel頻帶劃分時(shí),特別關(guān)注正常語(yǔ)音第一共振峰區(qū)域,并且給予了較大的權(quán)重。然而對(duì)于耳語(yǔ)音而言,其第一共振峰比正常語(yǔ)音向上偏移1.3倍,這可能導(dǎo)致在非共振峰頻段中的權(quán)重更大而在共振峰頻段中的權(quán)重較小,從而影響耳語(yǔ)音增強(qiáng)性能。(2)對(duì)于正常語(yǔ)音而言,人耳的敏感區(qū)域在第一共振峰附近,并且第一共振峰的位置也是能量集中的區(qū)域,所以Mel頻率尺度頻帶的劃分加重了F1區(qū)域的權(quán)重。然而,耳語(yǔ)音并非如此。根據(jù)徐柏齡等人的研究,耳語(yǔ)音中的第二共振峰的能量有時(shí)會(huì)大于第一共振峰。同時(shí),根據(jù)Sahar和John的實(shí)驗(yàn)結(jié)果,人耳對(duì)耳語(yǔ)音敏感區(qū)域在第二共振峰附近。因此,通過普通傳統(tǒng)的正常語(yǔ)音Mel頻率尺度劃分加重第一共振峰的方法與實(shí)際人耳的聽覺模型不一致。(3)由于對(duì)數(shù)曲線的特性,當(dāng)線性頻率f轉(zhuǎn)換為Mel頻率Mel(f)時(shí),隨著線性頻率f的增加,Mel(f)在低頻部分增長(zhǎng)較快,放置的頻段較多,權(quán)值較大,而高頻部分增長(zhǎng)較慢,頻段較少,權(quán)值較小。對(duì)于耳語(yǔ)音,由于它沒有基頻,并且第一共振峰向上偏移,所以低于500Hz的耳語(yǔ)音能量較小。這些低頻濾波器得到的功率譜主要是噪聲信號(hào)的頻譜,這將會(huì)影響耳語(yǔ)音增強(qiáng)的效果。
所以需要基于改進(jìn)的Mel頻率尺度多帶譜減法與修正相位譜結(jié)合產(chǎn)生修正后的復(fù)頻譜來增強(qiáng)語(yǔ)音。為了評(píng)估提出算法的性能,采用客觀評(píng)價(jià)和主觀評(píng)價(jià),來評(píng)價(jià)增強(qiáng)后耳語(yǔ)音的質(zhì)量。
發(fā)明內(nèi)容
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于南京師范大學(xué),未經(jīng)南京師范大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910146887.8/2.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
- 一種將耳語(yǔ)轉(zhuǎn)換為正常語(yǔ)音的裝置和方法
- 基于聲道參數(shù)的漢語(yǔ)耳語(yǔ)音聲調(diào)識(shí)別方法
- 基于徑向基神經(jīng)網(wǎng)絡(luò)的耳語(yǔ)音轉(zhuǎn)換為正常語(yǔ)音的方法
- 一種基于Gabor時(shí)頻分析的耳語(yǔ)增強(qiáng)方法
- 一種漢語(yǔ)耳語(yǔ)音的基頻估計(jì)方法
- 一種耳語(yǔ)音恢復(fù)方法、裝置、設(shè)備及可讀存儲(chǔ)介質(zhì)
- 基于改進(jìn)的Mel頻率尺度和相位修正的耳語(yǔ)音增強(qiáng)算法
- 改進(jìn)的Mel頻率尺度與耳語(yǔ)音共振峰結(jié)合的耳語(yǔ)音增強(qiáng)算法
- 耳語(yǔ)音處理方法及設(shè)備
- 語(yǔ)音增強(qiáng)方法、裝置、存儲(chǔ)介質(zhì)及電子設(shè)備
- 頻率自跟蹤變尺度隨機(jī)共振故障診斷系統(tǒng)
- 音頻信號(hào)時(shí)間尺度和頻率尺度縮放處理方法及設(shè)備
- 一種長(zhǎng)時(shí)間尺度電力系統(tǒng)頻率波動(dòng)仿真方法
- 一種基于頻率特征的耕地復(fù)種指數(shù)提取方法
- 一種識(shí)別不同尺度地層斷裂的相干處理方法
- 一種基于多尺度多重分形的HFECG信號(hào)特征頻率檢測(cè)方法
- 改進(jìn)的Mel頻率尺度與耳語(yǔ)音共振峰結(jié)合的耳語(yǔ)音增強(qiáng)算法
- 一種基于自適應(yīng)濾波器的風(fēng)力發(fā)電裝置穩(wěn)定器及控制方法
- 一種基于人耳聽覺頻率尺度信號(hào)分解的音頻編解碼方法
- 基于虛擬權(quán)重系數(shù)的風(fēng)/火電聯(lián)合頻率控制方法
- 噪聲抑制裝置及噪聲抑制方法
- 噪聲估計(jì)裝置、通話裝置、和噪聲估計(jì)方法
- 數(shù)字X射線膠片的噪聲評(píng)價(jià)方法
- OFDM系統(tǒng)的信道和噪聲方差聯(lián)合估計(jì)方法
- 處理裝置、處理方法、程序、計(jì)算機(jī)可讀信息記錄介質(zhì)以及處理系統(tǒng)
- 電參量計(jì)量過程中的噪聲功率估計(jì)裝置
- 噪聲估計(jì)方法、裝置、基站設(shè)備和計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)
- 噪聲估計(jì)方法、噪聲估計(jì)裝置、語(yǔ)音處理芯片以及電子設(shè)備
- 信號(hào)的噪聲估計(jì)方法及相關(guān)產(chǎn)品
- 噪聲估計(jì)方法、噪聲估計(jì)程序以及噪聲估計(jì)設(shè)備





