[發(fā)明專利]一種用于聲紋識(shí)別的低功耗模擬域特征向量提取方法有效
| 申請(qǐng)?zhí)枺?/td> | 202010577295.4 | 申請(qǐng)日: | 2020-06-22 |
| 公開(公告)號(hào): | CN111667838B | 公開(公告)日: | 2022-10-14 |
| 發(fā)明(設(shè)計(jì))人: | 浦寧;姜漢鈞;張春;王志華 | 申請(qǐng)(專利權(quán))人: | 清華大學(xué) |
| 主分類號(hào): | G10L17/02 | 分類號(hào): | G10L17/02;G10L17/18;G10L17/20 |
| 代理公司: | 西安智大知識(shí)產(chǎn)權(quán)代理事務(wù)所 61215 | 代理人: | 段俊濤 |
| 地址: | 100084 北京市海淀區(qū)1*** | 國(guó)省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說(shuō)明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 用于 聲紋 識(shí)別 功耗 模擬 特征向量 提取 方法 | ||
1.一種用于聲紋識(shí)別的低功耗模擬域特征向量提取方法,輸入為麥克風(fēng)輸出的語(yǔ)音信號(hào),從時(shí)域和模擬域提取特征,通過(guò)構(gòu)造一組帶通濾波器逼近MFCC特征提取中的Mel三角濾波器組,使得構(gòu)造的帶通濾波器組的中心頻率與Mel三角濾波器組相同,滿足非線性對(duì)數(shù)頻率特性,再將模擬濾波輸出的時(shí)域信號(hào)通過(guò)ADC后取模平方得到對(duì)應(yīng)特征值,其特征在于,包括對(duì)應(yīng)于全模擬濾波特征提取的高性能模式和對(duì)應(yīng)于混合特征提取的超低功耗模式兩種模式,其中:
所述高性能模式使用16個(gè)帶通濾波器進(jìn)行全模擬濾波特征提取,首先將麥克風(fēng)輸出的語(yǔ)音信號(hào)通過(guò)低噪聲前置放大器調(diào)理放大,然后分別輸入16個(gè)通道進(jìn)行帶通濾波,每個(gè)帶通濾波器的中心頻率模擬MFCC特征提取中Mel三角濾波器的中心頻率設(shè)計(jì);然后將提取到的模擬濾波特征通過(guò)12位逐次逼近型ADC轉(zhuǎn)換到數(shù)字域,在數(shù)字域完成求取模平方的操作得到對(duì)應(yīng)特征向量;
所述超低功耗模式通過(guò)壓縮相似的冗余特征以進(jìn)一步降低特征維度,采用5個(gè)帶通濾波器,1個(gè)比較器和數(shù)字邏輯電路實(shí)現(xiàn)混合特征提取,通過(guò)比較器和計(jì)數(shù)器提取語(yǔ)音信號(hào)的過(guò)零率,即統(tǒng)計(jì)信號(hào)幅值為0的次數(shù),過(guò)零率反映了語(yǔ)音信號(hào)的變化快慢,是一種從時(shí)域進(jìn)行提取而反映頻域信息的特征,輸入信號(hào)經(jīng)比較器與0電平比較后輸出一系列含高低電平的脈沖,其中高電平的上升沿和下降沿對(duì)應(yīng)語(yǔ)音信號(hào)的負(fù)過(guò)零和正過(guò)零,對(duì)高電平脈沖計(jì)數(shù),再乘以2得到語(yǔ)音信號(hào)的過(guò)零率,該模式提取的混合特征的維度是8維,包括5維模擬濾波特征及其均值和方差,再加上1維過(guò)零率特征。
2.根據(jù)權(quán)利要求1所述用于聲紋識(shí)別的低功耗模擬域特征向量提取方法,其特征在于,所述每個(gè)帶通濾波器的中心頻率模擬MFCC特征提取中Mel三角濾波器的中心頻率設(shè)計(jì),具體實(shí)現(xiàn)方式是將語(yǔ)音信號(hào)的常用采樣頻率按照該公式Mel(f)=2595*log10(1+f/700)轉(zhuǎn)換到梅爾頻率域,然后在梅爾頻率域按照濾波器個(gè)數(shù)進(jìn)行等間隔劃分,再將劃分的結(jié)果按上式轉(zhuǎn)換為對(duì)應(yīng)的自然頻率作為帶通濾波器的中心頻率,其中Mel(f)是梅爾頻率,f是自然頻率。
3.根據(jù)權(quán)利要求1所述用于聲紋識(shí)別的低功耗模擬域特征向量提取方法,其特征在于,所述帶通濾波器為非理想物理可實(shí)現(xiàn)的帶通濾波器,其階數(shù)為2階。
4.根據(jù)權(quán)利要求1或3所述用于聲紋識(shí)別的低功耗模擬域特征向量提取方法,其特征在于,所述帶通濾波器采用Gm-C結(jié)構(gòu),通過(guò)調(diào)整跨導(dǎo)器偏置電流的大小從而改變跨導(dǎo)器的Gm值,來(lái)達(dá)到改變?yōu)V波器中心頻率的目的。
5.根據(jù)權(quán)利要求4所述用于聲紋識(shí)別的低功耗模擬域特征向量提取方法,其特征在于,通過(guò)調(diào)整所述帶通濾波器的個(gè)數(shù)以得到不同維度的特征,從而滿足不同應(yīng)用場(chǎng)景下識(shí)別精度和功耗的折中。
6.根據(jù)權(quán)利要求1所述用于聲紋識(shí)別的低功耗模擬域特征向量提取方法,其特征在于,所述方法還用于關(guān)鍵詞檢測(cè)。
7.根據(jù)權(quán)利要求1所述用于聲紋識(shí)別的低功耗模擬域特征向量提取方法,其特征在于,所提取特征向量輸入數(shù)字域神經(jīng)網(wǎng)絡(luò)進(jìn)行識(shí)別。
8.根據(jù)權(quán)利要求7所述用于聲紋識(shí)別的低功耗模擬域特征向量提取方法,其特征在于,所述神經(jīng)網(wǎng)絡(luò)為CNN、LSTM或GRU。
9.根據(jù)權(quán)利要求1所述用于聲紋識(shí)別的低功耗模擬域特征向量提取方法,其特征在于,所述麥克風(fēng)輸出的語(yǔ)音信號(hào)先進(jìn)行分幀和加窗的預(yù)處理。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于清華大學(xué),未經(jīng)清華大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010577295.4/1.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 一種快速識(shí)別聲紋方法和系統(tǒng)
- 聲紋遙控器
- 一種自學(xué)習(xí)聲紋識(shí)別的更新方法和裝置
- 基于聲紋信息的身份認(rèn)證及識(shí)別方法
- 一種聲紋數(shù)據(jù)庫(kù)建立方法、聲紋識(shí)別方法、裝置及系統(tǒng)
- 聲紋信息的比對(duì)方法及裝置、儲(chǔ)存介質(zhì)、電子裝置
- 聲紋認(rèn)證方法、裝置、計(jì)算機(jī)設(shè)備以及存儲(chǔ)介質(zhì)
- 一種處理方法及電子設(shè)備
- 聲紋相似度智能識(shí)別系統(tǒng)、方法及存儲(chǔ)介質(zhì)
- 碰撞檢測(cè)方法、機(jī)器人、移動(dòng)終端及存儲(chǔ)介質(zhì)
- 識(shí)別媒體、識(shí)別媒體的識(shí)別方法、識(shí)別對(duì)象物品以及識(shí)別裝置
- 一種探針卡識(shí)別裝置和方法
- 識(shí)別裝置、識(shí)別方法以及記錄介質(zhì)
- 識(shí)別裝置、識(shí)別系統(tǒng),識(shí)別方法以及存儲(chǔ)介質(zhì)
- 識(shí)別程序、識(shí)別方法以及識(shí)別裝置
- 車載身份識(shí)別方法及系統(tǒng)
- 車載身份識(shí)別方法及系統(tǒng)
- 車載身份識(shí)別方法及系統(tǒng)
- 識(shí)別裝置、識(shí)別方法以及識(shí)別程序
- 識(shí)別裝置、識(shí)別方法及識(shí)別程序
- 一種基于功耗池的集群功耗分配方法
- 遠(yuǎn)端射頻單元及其功耗限制方法、以及基站控制器
- 一種基站功耗的監(jiān)測(cè)方法及裝置
- 一種整機(jī)柜功耗限制方法及裝置
- 功耗處理方法、裝置、電子設(shè)備及計(jì)算機(jī)可讀介質(zhì)
- 一種整機(jī)箱功耗的分配方法、系統(tǒng)、裝置及可讀存儲(chǔ)介質(zhì)
- 一種基于LSTM的機(jī)房功耗預(yù)警方法、系統(tǒng)、終端及存儲(chǔ)介質(zhì)
- 功耗調(diào)節(jié)方法、裝置、存儲(chǔ)介質(zhì)、服務(wù)器和終端
- 一種數(shù)據(jù)中心的功耗控制方法、系統(tǒng)及相關(guān)組件
- 一種延遲掉電省功耗方法和裝置





