[發明專利]一種用于聲紋識別的低功耗模擬域特征向量提取方法有效
| 申請號: | 202010577295.4 | 申請日: | 2020-06-22 |
| 公開(公告)號: | CN111667838B | 公開(公告)日: | 2022-10-14 |
| 發明(設計)人: | 浦寧;姜漢鈞;張春;王志華 | 申請(專利權)人: | 清華大學 |
| 主分類號: | G10L17/02 | 分類號: | G10L17/02;G10L17/18;G10L17/20 |
| 代理公司: | 西安智大知識產權代理事務所 61215 | 代理人: | 段俊濤 |
| 地址: | 100084 北京市海淀區1*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 用于 聲紋 識別 功耗 模擬 特征向量 提取 方法 | ||
本發明涉及一種低功耗的基于模擬域的語音特征提取方法,采用模擬域特征提取和數字域識別模型相結合的混合域架構來完成聲紋識別。由于經典數字域MFCC特征提取包含FFT、DCT等操作會消耗大量功耗,不滿足處于連續工作狀態的語音設備喚醒電路對低功耗和低計算量的要求。本發明提出的低維度低硬件開銷的模擬域語音特征提取方法可以具體延伸為全模擬濾波特征提取和混合特征提取2種模式,分別適用于對識別準確率要求較高和對超低功耗限制要求嚴格的應用場景。
技術領域
本發明屬于聲紋識別技術領域,特別涉及一種用于聲紋識別的低功耗模擬域特征向量提取方法。
背景技術
隨著電子信息技術的發展,物聯網逐漸成為人們關注的焦點。在物聯網時代,信息技術正改變著人們與電子設備的交互方式。因為人的聲音是一種最自然和最具信息量的人機交互方式,類似語音自動控制的人機交互在智能家居等應用場景中被廣泛采用,而其中智能聲紋識別或關鍵詞檢測喚醒電路具有重要的應用前景。通過語音來喚醒設備能有效提高能量效率,且無需接觸,使用方便。智能聲紋識別電路以低功耗的工作模式實時采集環境中的音頻信號,并檢測其中是否存在特定個體的語音信號,當偵測到特定說話人的有效語音信號時,啟動喚醒更高層次的系統。
此外,相比于語音活動檢測喚醒,聲紋識別喚醒能夠針對特定說話人發生響應,關鍵詞檢測喚醒能夠針對特定語音控制命令發生響應。其中一個應用場景是家庭中電視的語音喚醒,如果希望電視只對家長的語音喚醒而不喚醒小孩的語音,就需要對不同說話人進行聲紋識別從而判斷出具有喚醒權限的用戶。同時,聲紋識別與其他生物特征識別技術相比還具有方便直接,語音傳感采集設備成本低廉等優點。
由于不同說話人的發音器官在形態、大小和尺寸等物理結構方面有差異,加之受年齡、性別、讀音習慣等因素的影響,因此不同說話人的發音頻率和共振峰不會完全相同。可以說不同說話人的聲紋圖譜都略有差異,所以通過聲紋來識別不同說話人進而判斷說話人身份的方式是可行的。聲紋識別的傳統做法是將語音信號調理放大之后直接經過模-數轉換器(ADC)轉換成數字信號,在數字域完成特征提取和識別的任務。數字域梅爾頻率倒譜系數特征(MFCC) 提取的過程包括對輸入的語音信號進行預加重、分幀和加窗這些預處理操作,然后做FFT變換,取模平方,經過Mel三角濾波器組并將輸出取對數,最后做 DCT變換。因為其擁有良好的可分辨性,包含語音信息充分,成為語音識別、聲紋識別、關鍵詞檢測等語音信號處理任務中的經典特征。但是由于MFCC特征提取需要FFT、DCT等操作會消耗大量功耗,且計算復雜度較高,不利于低功耗的硬件實現。
此外,經典MFCC特征通常包含13維靜態特征,13維一階差分系數和13 維二階差分系數共39維特征。較高的特征維度使得輸入后續識別模型例如神經網絡的特征比特率也很高,從而神經網絡識別模型的參數量和乘累加運算量較大,導致神經網絡的功耗較大。這限制了聲紋識別從服務器端向邊緣端擴展,難以滿足電池容量較小且需要連續工作的智能聲紋識別設備喚醒應用的需求。
發明內容
為了克服上述現有技術中經典數字域MFCC特征提取存在的主要缺點,本發明的目的在于提供一種用于聲紋識別的低功耗模擬域特征向量提取方法,可降低特征輸入后續識別模型的比特率,進一步減小識別模型的功耗和計算量,具有低功耗,低維度,低計算復雜度等特點。并可將特征進一步輸入數字域神經網絡等模型進行聲紋識別,對智能聲紋識別喚醒等語音信號處理任務的邊緣端實現和性能優化產生重要意義。
為了實現上述目的,本發明采用的技術方案是:
一種用于聲紋識別的低功耗模擬域特征向量提取方法,輸入為麥克風輸出的語音信號,從時域和模擬域提取特征,通過構造一組帶通濾波器逼近MFCC 特征提取中的Mel三角濾波器組,使得構造的帶通濾波器組的中心頻率與Mel 三角濾波器組相同,滿足非線性對數頻率特性,再將模擬濾波輸出的時域信號通過ADC后取模平方得到對應特征值。
本發明包括對應于全模擬濾波特征提取的高性能模式和對應于混合特征提取的超低功耗模式兩種模式,其中:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于清華大學,未經清華大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010577295.4/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種水稻愈傷組織的超低溫保存方法
- 下一篇:一種自動調節座椅





