[發(fā)明專利]一種強(qiáng)背景噪聲下的語音提取方法無效

申請?zhí)枺?/td>	201310646708.X	申請日：	2013-12-04
公開（公告）號：	CN103617798A	公開（公告）日：	2014-03-05
發(fā)明（設(shè)計(jì)）人：	周龍甫;呼永河;張超群;李正;郝大鵬;趙明	申請（專利權(quán)）人：	中國人民解放軍成都軍區(qū)總醫(yī)院
主分類號：	G10L21/0208	分類號：	G10L21/0208
代理公司：	成都行之專利代理事務(wù)所(普通合伙) 51220	代理人：	溫利平
地址：	610083***	國省代碼：	四川;51
權(quán)利要求書：	查看更多	說明書：	查看更多
摘要：
搜索關(guān)鍵詞：	一種背景噪聲語音提取方法
鉆瓜網(wǎng) 技術(shù)展會(huì) 專利詞庫專利權(quán)人專利榜在售專利公布日期熱門專利

【說明書】：

技術(shù)領(lǐng)域

本發(fā)明屬于語音提取技術(shù)領(lǐng)域，更為具體地講，涉及一種強(qiáng)背景噪聲下的語音提取方法。

背景技術(shù)

在某些具有強(qiáng)背景噪聲環(huán)境的場合，如高速公路旁、轟鳴的車輛內(nèi)、喧鬧的人群中等等，如何消除強(qiáng)背景噪聲并有效提取用戶語音，是這些特殊場合中的語音識別裝置需要解決的主要問題之一。

目前，各種語音通信裝置主要采用的降噪技術(shù)包括：

1）基于模型的降噪方法，典型的如“谷歌公司.用于語音識別的語音模型和噪聲模型.中國發(fā)明專利,CN103069480A,2013-04-24”中公開的用于語音識別的語音模型和噪聲模型，通過設(shè)定適配規(guī)則來對接收到的音頻信號進(jìn)行濾波和噪聲補(bǔ)償。該方法在適配度較高的情況下具有良好的去噪效果，但需要較多的先驗(yàn)知識來預(yù)先構(gòu)建用戶語音和噪聲模型。

2）主動(dòng)噪聲消除方法，典型的如“無錫中星微電子有限公司.一種語音降噪裝置.中國發(fā)明專利，CN101853667A，2010.10.06”中公開的語音降噪裝置，采用揚(yáng)聲器、麥克風(fēng)、輸出和輸入增益構(gòu)建負(fù)反饋閉環(huán)系統(tǒng)，通過麥克風(fēng)采集背景噪聲后主動(dòng)生成反噪聲信號與揚(yáng)聲器的輸入信號進(jìn)行疊加達(dá)到噪聲消除的效果。該方法適用于在強(qiáng)噪聲背景下進(jìn)行語音播放的場合，不適用于需要在背景噪聲中有效提取用戶語音的場合。

3）基于多麥克風(fēng)的濾波降噪方法，典型的如“通用汽車環(huán)球科技運(yùn)作有限責(zé)任公司.統(tǒng)一標(biāo)準(zhǔn)的麥克風(fēng)預(yù)處理系統(tǒng)和方法.中國發(fā)明專利,CN102595281A,2012.07.18”中公開的信號預(yù)處理系統(tǒng)，通過在語音采集現(xiàn)場部署麥克風(fēng)陣列來支持通話處理、自動(dòng)語音識別處理和噪聲消除處理等應(yīng)用。麥克風(fēng)陣列的廣泛部署能夠通過多源信號采集獲取目標(biāo)聲源和噪聲源在空間域上的區(qū)別，較好的實(shí)現(xiàn)噪聲消除，但缺點(diǎn)在于難以在移動(dòng)和小范圍場景（如運(yùn)動(dòng)人體上）部署。

4）基于信號分析和處理的降噪方法，該類方法的主要思想是針對目標(biāo)語音和噪聲成分在時(shí)-頻域上的特征差異來進(jìn)行信號分離。典型的如“西北工業(yè)大學(xué).一種基于小波變換和變步長最小均方算法的語音降噪方法.中國發(fā)明專利，CN101894561A，2010.11.24”公開的語音降噪方法，該方法充分利用了小波變換在時(shí)-頻局部分析方面的優(yōu)勢，并引入步長動(dòng)態(tài)算法來控制收斂速度，具有較快的響應(yīng)時(shí)間和失調(diào)度，但步長因子的確定仍缺乏有效方法，限制了其對不同噪聲環(huán)境的適應(yīng)能力。

發(fā)明內(nèi)容

本發(fā)明的目的在于克服現(xiàn)有技術(shù)的不足，提供一種強(qiáng)背景噪聲下的語音提取方法，采用小波神經(jīng)網(wǎng)絡(luò)作為濾波器，其中小波神經(jīng)網(wǎng)絡(luò)的參數(shù)由粒子群算法得到，可適應(yīng)各種典型白噪聲環(huán)境。

為實(shí)現(xiàn)上述發(fā)明目的，本發(fā)明強(qiáng)背景噪聲下的語音提取方法，包括以下步驟：

S1：對含有強(qiáng)背景噪聲的原始語音信號進(jìn)行預(yù)處理，包括離散采樣和量化，提取P個(gè)由M個(gè)采樣點(diǎn)構(gòu)成的數(shù)據(jù)幀f^p(t_m)，其中，p＝0,1,…,P表示數(shù)據(jù)所處的幀號，m＝0,1,…,M表示為樣本號；

S2：構(gòu)建小波神經(jīng)網(wǎng)絡(luò)模型，其模型公式為：

下載完整專利技術(shù)內(nèi)容需要扣除積分，VIP會(huì)員可以免費(fèi)下載。

免登錄下載普通用戶下載升級VIP會(huì)員，免費(fèi)下載

該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息，商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于中國人民解放軍成都軍區(qū)總醫(yī)院，未經(jīng)中國人民解放軍成都軍區(qū)總醫(yī)院許可，擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作，請聯(lián)系【客服】

本文鏈接：http://www.szxzyx.cn/pat/books/201310646708.X/2.html，轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。

上一篇：鐵電單晶鈮釔酸鉛-鈮鎂酸鉛-鈦酸鉛及其制備和用途
下一篇：一種不銹鋼鈍化節(jié)能環(huán)保新工藝

同類專利

專利分類

G 物理

G10 樂器；聲學(xué)
G10L 語音分析或合成；語音識別；音頻分析或處理
G10L21-00 為了改變語音信號的質(zhì)量或其可識度而處理語音信號，以產(chǎn)生另一種可聽的或非可聽的信號，例如視覺信號或觸覺信號
G10L21-02 .語音增強(qiáng)，例如降低噪聲或消除回聲
G10L21-04 .時(shí)間壓縮或擴(kuò)展
G10L21-06 .將語音轉(zhuǎn)換成非可聽表達(dá)形式，例如語音可視化、觸覺輔助的語音處理

免登錄下載普通用戶下載升級VIP會(huì)員，免費(fèi)下載

專利文獻(xiàn)下載

說明：

1、專利原文基于中國國家知識產(chǎn)權(quán)局專利說明書；

2、支持發(fā)明專利、實(shí)用新型專利、外觀設(shè)計(jì)專利（升級中）；

3、專利數(shù)據(jù)每周兩次同步更新，支持Adobe PDF格式；

4、內(nèi)容包括專利技術(shù)的結(jié)構(gòu)示意圖、流程工藝圖或技術(shù)構(gòu)造圖；

5、已全新升級為極速版,下載速度顯著提升！歡迎使用！

請您登陸后，進(jìn)行下載，點(diǎn)擊【登陸】【注冊】