[發(fā)明專(zhuān)利]一種噪聲環(huán)境下聲紋識(shí)別的語(yǔ)音特征處理方法有效
| 申請(qǐng)?zhí)枺?/td> | 201610125032.3 | 申請(qǐng)日: | 2016-03-04 |
| 公開(kāi)(公告)號(hào): | CN105679312B | 公開(kāi)(公告)日: | 2019-09-10 |
| 發(fā)明(設(shè)計(jì))人: | 張毅;謝延義;徐曉東;蕭紅;羅久飛;黃超;王可佳;倪雷 | 申請(qǐng)(專(zhuān)利權(quán))人: | 重慶郵電大學(xué) |
| 主分類(lèi)號(hào): | G10L15/02 | 分類(lèi)號(hào): | G10L15/02;G10L19/02;G10L21/0332 |
| 代理公司: | 重慶市恒信知識(shí)產(chǎn)權(quán)代理有限公司 50102 | 代理人: | 劉小紅 |
| 地址: | 400065 *** | 國(guó)省代碼: | 重慶;50 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 噪聲 環(huán)境 聲紋 識(shí)別 語(yǔ)音 特征 處理 方法 | ||
技術(shù)領(lǐng)域
本發(fā)明涉及語(yǔ)音信號(hào)處理領(lǐng)域,提出一種基于基音特性和噪聲特性的語(yǔ)音特征提 取方法。
背景技術(shù)
隨著語(yǔ)音科學(xué)與信息通信技術(shù)的發(fā)展,作為更加便捷的身份驗(yàn)證技術(shù),聲紋識(shí)別 技術(shù)取得了顯著的進(jìn)步。語(yǔ)言作為人類(lèi)最基礎(chǔ)的自然屬性之一,是人類(lèi)之間信息傳遞最直 接便捷的方式。作為個(gè)體的人的發(fā)聲器官不僅與先天因素有關(guān),而且受后天發(fā)育環(huán)境等因 素的影響較大,因此語(yǔ)音有十分顯著的個(gè)體色彩。這種個(gè)體上的特點(diǎn)同時(shí)衍生了一個(gè)科學(xué) 研究熱點(diǎn)——聲紋識(shí)別。當(dāng)一個(gè)個(gè)體在說(shuō)話(huà)人時(shí),所產(chǎn)生的語(yǔ)音與個(gè)體的發(fā)聲習(xí)慣、發(fā)聲器 官等因素有關(guān),這些因素是相對(duì)穩(wěn)定的,一般情況下差異較小,因此個(gè)體之間的聲紋圖譜都 存在差異。因此人的聲音可以作為人的身份標(biāo)識(shí),是一個(gè)相對(duì)穩(wěn)定的生命信號(hào)。聲紋識(shí)別就 是將人的發(fā)聲特性作為標(biāo)識(shí),對(duì)人的身份進(jìn)行驗(yàn)證的一項(xiàng)科學(xué)技術(shù)。
語(yǔ)音信號(hào)中的基音周期是語(yǔ)音的一大特性,它描述了語(yǔ)音激勵(lì)源的一個(gè)特征。但 由于人的基音周期的范圍很寬,且同一個(gè)體在不同的情感環(huán)境中發(fā)音的基音周期也不相 同,加之基音周期還會(huì)受到發(fā)音音調(diào)的影響,因此將基音作為聲紋特征是比較困難的事情, 而且基音也會(huì)通過(guò)影響語(yǔ)音特征參數(shù),影響聲紋識(shí)別的結(jié)果。因此本發(fā)明的譜包絡(luò)平滑法 正是基于這一特性,去除了基音的影響。
魯棒性是聲紋識(shí)別技術(shù)的關(guān)鍵,一個(gè)訓(xùn)練好的聲紋識(shí)別系統(tǒng)通常需要在各種日常 的環(huán)境下工作。聲學(xué)模型只使用語(yǔ)音樣本庫(kù)中的數(shù)據(jù)進(jìn)行訓(xùn)練,而語(yǔ)音的采集通常在低噪 聲的環(huán)境下,往往很難與多種噪聲環(huán)境相匹配,環(huán)境噪聲造成的特征扭曲降低了聲紋識(shí)別 的魯棒性。環(huán)境噪聲根據(jù)其特性可以分為加性噪聲和減性噪聲兩種,如何有效的去除這兩 種噪聲的干擾是關(guān)鍵所在。語(yǔ)音特征的后處理算法在前期特征的基礎(chǔ)上進(jìn)行處理,不僅減 小了算法的復(fù)雜性,而且有利于提高語(yǔ)音的聲紋特性。
發(fā)明內(nèi)容
針對(duì)以上現(xiàn)有技術(shù)的不足,提出了一種方法。本發(fā)明的技術(shù)方案如下:一種噪聲環(huán) 境下聲紋識(shí)別的語(yǔ)音特征處理方法,該方法包括以下幾個(gè)步驟:
步驟1:獲取噪聲環(huán)境下的語(yǔ)音信號(hào),根據(jù)語(yǔ)音的特點(diǎn)對(duì)信號(hào)進(jìn)行前期處理,包括 預(yù)加重處理,加窗處理和端點(diǎn)檢測(cè);
步驟2:估算發(fā)聲個(gè)體的基音周期,并以此為依據(jù)對(duì)語(yǔ)音信號(hào)進(jìn)行譜平滑處理,得 到新的譜包絡(luò),計(jì)算通過(guò)梅爾濾波器的能量,最終通過(guò)DCT倒譜計(jì)算得到中間信號(hào)SFCC;
步驟3:結(jié)合均值消減法、方差歸一化、時(shí)間序列濾波法和加權(quán)自回歸移動(dòng)平均濾 波法依次對(duì)步驟2得到的SFCC進(jìn)行后處理,得到最終語(yǔ)音特征MVDA。
進(jìn)一步的,步驟1對(duì)信號(hào)進(jìn)行前期處理,具體為:步驟A1:根據(jù)口腔的輻射響應(yīng)接近 于一階高通函數(shù)的特性,采用的預(yù)加重濾波器為x′(n)=x(n)-a*x(n-1),公式中a是常數(shù),x (n)為原信號(hào),x′(n)為預(yù)加重信號(hào),n為時(shí)域內(nèi)語(yǔ)音的采樣點(diǎn)。
步驟A2:采用漢明窗對(duì)語(yǔ)音信號(hào)進(jìn)行加窗處理;
步驟A3:采用短時(shí)平均能量和短時(shí)平均過(guò)零率的雙門(mén)限法對(duì)語(yǔ)音信號(hào)進(jìn)行端點(diǎn)檢 測(cè)。
進(jìn)一步的,所述步驟2,具體步驟如下:
步驟B1:首先利用倒譜法基音檢測(cè)估算每一幀語(yǔ)音的基音周期;
步驟B2:對(duì)每一幀信號(hào)進(jìn)行快速傅里葉變換,計(jì)算譜線能量;
步驟B3:對(duì)得到的能量譜求其譜包絡(luò),利用譜包絡(luò)平滑函數(shù)對(duì)譜包絡(luò)進(jìn)行平滑處 理;
步驟B4:計(jì)算通過(guò)Mel濾波器組的能量,計(jì)算DCT倒譜得到SFCC。
該專(zhuān)利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專(zhuān)利權(quán)人授權(quán)。該專(zhuān)利全部權(quán)利屬于重慶郵電大學(xué),未經(jīng)重慶郵電大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買(mǎi)此專(zhuān)利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201610125032.3/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專(zhuān)利網(wǎng)。
- 上一篇:語(yǔ)音識(shí)別方法和裝置
- 下一篇:一種樂(lè)鼓鼓圈
- 同類(lèi)專(zhuān)利
- 專(zhuān)利分類(lèi)
G10L 語(yǔ)音分析或合成;語(yǔ)音識(shí)別;音頻分析或處理
G10L15-00 語(yǔ)音識(shí)別
G10L15-02 .語(yǔ)音識(shí)別的特征提取;識(shí)別單位的選擇
G10L15-04 .分段或字極限檢測(cè)
G10L15-06 .創(chuàng)建基準(zhǔn)模板;訓(xùn)練語(yǔ)音識(shí)別系統(tǒng),例如對(duì)說(shuō)話(huà)者聲音特征的適應(yīng)
G10L15-08 .語(yǔ)音分類(lèi)或檢索
G10L15-20 .專(zhuān)門(mén)適用于不利環(huán)境
- 環(huán)境服務(wù)系統(tǒng)以及環(huán)境服務(wù)事業(yè)
- 環(huán)境控制裝置、環(huán)境控制方法、環(huán)境控制程序及環(huán)境控制系統(tǒng)
- 環(huán)境檢測(cè)終端和環(huán)境檢測(cè)系統(tǒng)
- 環(huán)境調(diào)整系統(tǒng)、環(huán)境調(diào)整方法及環(huán)境調(diào)整程序
- 環(huán)境估計(jì)裝置和環(huán)境估計(jì)方法
- 用于環(huán)境艙的環(huán)境控制系統(tǒng)及環(huán)境艙
- 車(chē)輛環(huán)境的環(huán)境數(shù)據(jù)處理
- 環(huán)境取樣動(dòng)力頭、環(huán)境取樣方法
- 環(huán)境艙環(huán)境控制系統(tǒng)
- 環(huán)境檢測(cè)儀(環(huán)境貓)
- 一種快速識(shí)別聲紋方法和系統(tǒng)
- 聲紋遙控器
- 一種自學(xué)習(xí)聲紋識(shí)別的更新方法和裝置
- 基于聲紋信息的身份認(rèn)證及識(shí)別方法
- 一種聲紋數(shù)據(jù)庫(kù)建立方法、聲紋識(shí)別方法、裝置及系統(tǒng)
- 聲紋信息的比對(duì)方法及裝置、儲(chǔ)存介質(zhì)、電子裝置
- 聲紋認(rèn)證方法、裝置、計(jì)算機(jī)設(shè)備以及存儲(chǔ)介質(zhì)
- 一種處理方法及電子設(shè)備
- 聲紋相似度智能識(shí)別系統(tǒng)、方法及存儲(chǔ)介質(zhì)
- 碰撞檢測(cè)方法、機(jī)器人、移動(dòng)終端及存儲(chǔ)介質(zhì)
- 識(shí)別媒體、識(shí)別媒體的識(shí)別方法、識(shí)別對(duì)象物品以及識(shí)別裝置
- 一種探針卡識(shí)別裝置和方法
- 識(shí)別裝置、識(shí)別方法以及記錄介質(zhì)
- 識(shí)別裝置、識(shí)別系統(tǒng),識(shí)別方法以及存儲(chǔ)介質(zhì)
- 識(shí)別程序、識(shí)別方法以及識(shí)別裝置
- 車(chē)載身份識(shí)別方法及系統(tǒng)
- 車(chē)載身份識(shí)別方法及系統(tǒng)
- 車(chē)載身份識(shí)別方法及系統(tǒng)
- 識(shí)別裝置、識(shí)別方法以及識(shí)別程序
- 識(shí)別裝置、識(shí)別方法及識(shí)別程序





