[發(fā)明專利]利用能量譜熵空間信息的語音端點檢測裝置及其檢測方法無效
| 申請?zhí)枺?/td> | 201310370059.5 | 申請日: | 2013-08-22 |
| 公開(公告)號: | CN103426440A | 公開(公告)日: | 2013-12-04 |
| 發(fā)明(設(shè)計)人: | 童峰;李芳蘭;洪青陽;周躍海 | 申請(專利權(quán))人: | 廈門大學(xué) |
| 主分類號: | G10L25/78 | 分類號: | G10L25/78 |
| 代理公司: | 廈門南強之路專利事務(wù)所(普通合伙) 35200 | 代理人: | 馬應(yīng)森;曾權(quán) |
| 地址: | 361005 *** | 國省代碼: | 福建;35 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 利用 能量 空間 信息 語音 端點 檢測 裝置 及其 方法 | ||
技術(shù)領(lǐng)域
本發(fā)明涉及一種語音信號處理裝置,尤其是涉及一種綜合利用能量譜熵空間信息的語音端點檢測裝置及其檢測方法。?
背景技術(shù)
在語音識別、聲紋識別、視頻會議等語音信號處理中利用語音的某種特性將有話部分和無話部分區(qū)分出來,稱為語音端點檢測。準確的語音端點檢測將提高語音處理系統(tǒng)的處理效率和減少語音處理的數(shù)據(jù)量,從而達到提高語音識別系統(tǒng)識別性能的目的。常用的端點檢測算法有基于短時能量和過零率、短時自相關(guān)、譜熵檢測等,在安靜的背景環(huán)境下,這些成熟的語音端點檢測算法都有很好的端點檢測性能,但在實際使用的帶背景噪聲的環(huán)境下,這些算法的檢測性能往往不能令人滿意。考慮到實際使用的大部分情況下采集到的語音信號是有背景噪聲的,因此,研究可適應(yīng)不同背景噪聲情況下的語音端點檢測對于提高語音信號處理系統(tǒng)的穩(wěn)健性和實用性都起著關(guān)鍵的作用。?
中國專利ZL?200910088491.9公開一種低信噪比條件下的語音端點檢測方法及裝置,該方法對分幀語音信號進行子帶功率譜熵概率密度加權(quán)處理,得到每個語音幀的子帶加權(quán)功率譜熵,根據(jù)閾值進行端點檢測,并根據(jù)實際應(yīng)用環(huán)境自適應(yīng)地選擇子帶數(shù)目和權(quán)重因子,提高了端點檢測的準確性和精確度。?
中國專利ZL?200910135606.5公開一種可適應(yīng)復(fù)雜噪聲背景的端點檢測方法及使用該方法的系統(tǒng),該發(fā)明使用基頻提取結(jié)合子帶能量的方法對語音信號進行檢測,由于語音中元音有基頻,而基頻擁有很強的語音特征,受噪聲影響較小,使得元音的提取擁有很高的魯棒性。并可改善不斷變化的背景噪聲下的端點檢測性能。?
中國專利200510089957.9公開一種基于能量及諧波的語音端點檢測方法,該方法利用能量進行語音起點初判,然后搜索具有濁音諧波特征的信號進行語音起點的準備檢測,由于諧波檢測可過濾突發(fā)噪聲,因此該方法可適應(yīng)噪聲突變對語音端點檢測的影響。?
但是,背景噪聲除了前述幾種方法所針對的非白噪聲、突發(fā)噪聲等非語音噪聲,在大量使用移動電話、智能終端進行的人機交互語音識別、聲紋識別等語音信號處理場合,除了目?標說話人外,往往存在其他說話人的語音干擾。此時,與上述幾種方法可結(jié)合語音信號頻譜,基頻、濁音諧波特性等特征改善端點檢測的噪聲穩(wěn)健性不同,由于有用語音信號混雜的是具有同樣語音特性的其他說話人語音噪聲,需利用其他信息來排除語音噪聲的影響,保證端點檢測的性能。?
麥克風陣列(L.J.Griffiths,C.W.Jim.An?alternative?approach?to?linearly?constrained?adaptive?beamforming.IEEE?Transactions?on?Antennas?and?Propagation.January,1982,vol.30,pp27-34;Sharon?Gannot,Israel?Cohen.Speech?Enhancement?Based?on?the?General?Transfer?Function?GSC?and?Post?filtering.IEEE?Transactions?on?Speech?and?Audio?Processing.2004,vol.12,no.6;A?Abad,J?Hernando.Speech?Enhancement?and?recognition?by?Integrating?Adaptive?Beamforming?and?Wiener?Filtering.IEEE?Sensor?Array?and?Multichannel?Signal?Processing?Workshop,SAM,Sitges,2004)由多個麥克風按照一定拓撲結(jié)構(gòu)組成,其采集到的信號在時頻域的基礎(chǔ)上增加了空間域信息,從而可對采集到的多路信號進行空時分集處理,麥克風陣列可對不同方向上的信號形成不同響應(yīng),也即陣列的空間指向特性,使陣列麥克風具有聲源定位和跟蹤、語音提取和分離以及去噪等功能,從而提高在復(fù)雜背景下的語音信號質(zhì)量,彌補孤立麥克風無法獲取和利用空間信息的缺陷。目前,各類移動電話、智能終端普遍開始配置由兩個或多個麥克風組成的麥克風陣列以提高語音信號處理性能,但目前的各類端點檢測算法大多基于單麥克風,未采用麥克風陣列提供的聲源空間信息來改善性能。?
發(fā)明內(nèi)容
本發(fā)明的目的在于提供一種綜合利用能量譜熵空間信息的語音端點檢測裝置及其檢測方法。?
本發(fā)明所述利用能量譜熵空間信息的語音端點檢測裝置設(shè)有:?
麥克風陣列,用于語音信號多通道采集、前置處理和模數(shù)轉(zhuǎn)換;?
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于廈門大學(xué),未經(jīng)廈門大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201310370059.5/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 信息記錄介質(zhì)、信息記錄方法、信息記錄設(shè)備、信息再現(xiàn)方法和信息再現(xiàn)設(shè)備
- 信息記錄裝置、信息記錄方法、信息記錄介質(zhì)、信息復(fù)制裝置和信息復(fù)制方法
- 信息記錄裝置、信息再現(xiàn)裝置、信息記錄方法、信息再現(xiàn)方法、信息記錄程序、信息再現(xiàn)程序、以及信息記錄介質(zhì)
- 信息記錄裝置、信息再現(xiàn)裝置、信息記錄方法、信息再現(xiàn)方法、信息記錄程序、信息再現(xiàn)程序、以及信息記錄介質(zhì)
- 信息記錄設(shè)備、信息重放設(shè)備、信息記錄方法、信息重放方法、以及信息記錄介質(zhì)
- 信息存儲介質(zhì)、信息記錄方法、信息重放方法、信息記錄設(shè)備、以及信息重放設(shè)備
- 信息存儲介質(zhì)、信息記錄方法、信息回放方法、信息記錄設(shè)備和信息回放設(shè)備
- 信息記錄介質(zhì)、信息記錄方法、信息記錄裝置、信息再現(xiàn)方法和信息再現(xiàn)裝置
- 信息終端,信息終端的信息呈現(xiàn)方法和信息呈現(xiàn)程序
- 信息創(chuàng)建、信息發(fā)送方法及信息創(chuàng)建、信息發(fā)送裝置





