[發(fā)明專利]一種強(qiáng)背景噪聲下的語音提取方法無效
| 申請?zhí)枺?/td> | 201310646708.X | 申請日: | 2013-12-04 |
| 公開(公告)號: | CN103617798A | 公開(公告)日: | 2014-03-05 |
| 發(fā)明(設(shè)計(jì))人: | 周龍甫;呼永河;張超群;李正;郝大鵬;趙明 | 申請(專利權(quán))人: | 中國人民解放軍成都軍區(qū)總醫(yī)院 |
| 主分類號: | G10L21/0208 | 分類號: | G10L21/0208 |
| 代理公司: | 成都行之專利代理事務(wù)所(普通合伙) 51220 | 代理人: | 溫利平 |
| 地址: | 610083*** | 國省代碼: | 四川;51 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 背景 噪聲 語音 提取 方法 | ||
技術(shù)領(lǐng)域
本發(fā)明屬于語音提取技術(shù)領(lǐng)域,更為具體地講,涉及一種強(qiáng)背景噪聲下的語音提取方法。
背景技術(shù)
在某些具有強(qiáng)背景噪聲環(huán)境的場合,如高速公路旁、轟鳴的車輛內(nèi)、喧鬧的人群中等等,如何消除強(qiáng)背景噪聲并有效提取用戶語音,是這些特殊場合中的語音識別裝置需要解決的主要問題之一。
目前,各種語音通信裝置主要采用的降噪技術(shù)包括:
1)基于模型的降噪方法,典型的如“谷歌公司.用于語音識別的語音模型和噪聲模型.中國發(fā)明專利,CN103069480A,2013-04-24”中公開的用于語音識別的語音模型和噪聲模型,通過設(shè)定適配規(guī)則來對接收到的音頻信號進(jìn)行濾波和噪聲補(bǔ)償。該方法在適配度較高的情況下具有良好的去噪效果,但需要較多的先驗(yàn)知識來預(yù)先構(gòu)建用戶語音和噪聲模型。
2)主動(dòng)噪聲消除方法,典型的如“無錫中星微電子有限公司.一種語音降噪裝置.中國發(fā)明專利,CN101853667A,2010.10.06”中公開的語音降噪裝置,采用揚(yáng)聲器、麥克風(fēng)、輸出和輸入增益構(gòu)建負(fù)反饋閉環(huán)系統(tǒng),通過麥克風(fēng)采集背景噪聲后主動(dòng)生成反噪聲信號與揚(yáng)聲器的輸入信號進(jìn)行疊加達(dá)到噪聲消除的效果。該方法適用于在強(qiáng)噪聲背景下進(jìn)行語音播放的場合,不適用于需要在背景噪聲中有效提取用戶語音的場合。
3)基于多麥克風(fēng)的濾波降噪方法,典型的如“通用汽車環(huán)球科技運(yùn)作有限責(zé)任公司.統(tǒng)一標(biāo)準(zhǔn)的麥克風(fēng)預(yù)處理系統(tǒng)和方法.中國發(fā)明專利,CN102595281A,2012.07.18”中公開的信號預(yù)處理系統(tǒng),通過在語音采集現(xiàn)場部署麥克風(fēng)陣列來支持通話處理、自動(dòng)語音識別處理和噪聲消除處理等應(yīng)用。麥克風(fēng)陣列的廣泛部署能夠通過多源信號采集獲取目標(biāo)聲源和噪聲源在空間域上的區(qū)別,較好的實(shí)現(xiàn)噪聲消除,但缺點(diǎn)在于難以在移動(dòng)和小范圍場景(如運(yùn)動(dòng)人體上)部署。
4)基于信號分析和處理的降噪方法,該類方法的主要思想是針對目標(biāo)語音和噪聲成分在時(shí)-頻域上的特征差異來進(jìn)行信號分離。典型的如“西北工業(yè)大學(xué).一種基于小波變換和變步長最小均方算法的語音降噪方法.中國發(fā)明專利,CN101894561A,2010.11.24”公開的語音降噪方法,該方法充分利用了小波變換在時(shí)-頻局部分析方面的優(yōu)勢,并引入步長動(dòng)態(tài)算法來控制收斂速度,具有較快的響應(yīng)時(shí)間和失調(diào)度,但步長因子的確定仍缺乏有效方法,限制了其對不同噪聲環(huán)境的適應(yīng)能力。
發(fā)明內(nèi)容
本發(fā)明的目的在于克服現(xiàn)有技術(shù)的不足,提供一種強(qiáng)背景噪聲下的語音提取方法,采用小波神經(jīng)網(wǎng)絡(luò)作為濾波器,其中小波神經(jīng)網(wǎng)絡(luò)的參數(shù)由粒子群算法得到,可適應(yīng)各種典型白噪聲環(huán)境。
為實(shí)現(xiàn)上述發(fā)明目的,本發(fā)明強(qiáng)背景噪聲下的語音提取方法,包括以下步驟:
S1:對含有強(qiáng)背景噪聲的原始語音信號進(jìn)行預(yù)處理,包括離散采樣和量化,提取P個(gè)由M個(gè)采樣點(diǎn)構(gòu)成的數(shù)據(jù)幀fp(tm),其中,p=0,1,…,P表示數(shù)據(jù)所處的幀號,m=0,1,…,M表示為樣本號;
S2:構(gòu)建小波神經(jīng)網(wǎng)絡(luò)模型,其模型公式為:
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于中國人民解放軍成都軍區(qū)總醫(yī)院,未經(jīng)中國人民解放軍成都軍區(qū)總醫(yī)院許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201310646708.X/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





