[發明專利]復雜噪音下的聲紋識別系統在審
| 申請號: | 201611231657.4 | 申請日: | 2016-12-23 |
| 公開(公告)號: | CN108242240A | 公開(公告)日: | 2018-07-03 |
| 發明(設計)人: | 張學陽 | 申請(專利權)人: | 張學陽 |
| 主分類號: | G10L17/08 | 分類號: | G10L17/08;G10L17/04;G10L17/02 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 214000 江蘇省無錫市*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 背景噪音 聲紋識別 噪音 語音 語音端點檢測模塊 聲紋識別系統 特征提取模塊 語音采集模塊 語音識別技術 多模型訓練 抗干擾能力 密碼鎖系統 預處理階段 復雜背景 模型訓練 判別模塊 語音內容 語音識別 可識別 準確率 構建 濾除 算法 語句 匹配 引入 分類 | ||
本發明涉及到了一種基于聲紋識別技術的密碼鎖系統,該系統主要有不同背景噪音下的語音采集模塊,背景噪音區分模塊,背景噪音濾除模塊,語音端點檢測模塊,語音MFCC特征提取模塊,VQ多模型訓練模塊,語音識別判斷命令詞模塊,說話人判別模塊。該系統有兩大特點,一是在說話人預處理階段通過特定的識別算法能夠將背景噪音進行分類,并且分別進行處理,從而達到了在復雜背景噪音具有可識別能力;二是在語音的模型訓練階段,對于說話人不同的訓練語句分別構建模型,在識別階段引入語音識別技術來識別語音內容,然后與對應的模型進行匹配,從而大大提高了聲紋識別的準確率。本發明適應能力以及抗干擾能力強,識別精度高。
技術領域
本發明涉及到一種在復雜噪音下的聲紋識別系統,同時也包含語音信號處理,計算機領域以及人工智能領域。
背景技術
隨著信息技術以及互聯網行業的飛速發展,人工智能領域越來越受到人們的關注,作為人工智能領域的重要組成部分——聲紋識別技術在信息安全,防偽鑒別,公安司法以及軍事國防等領域越來越受到重視。
聲紋識別主要分為模型訓練和語音識別兩個階段,兩個階段都需要經過語音的預處理和特征提取階段,模型訓練階段是對已有的語音通過數學方法進行建模,語音識別階段是根據訓練好的模型進行說話人判別
識別結果的準確率受到很多因素影響,包括說話人的情緒,說話時的背景噪音以及模型訓練方式等,采用合理的方式處理上述過程對提高最終的識別結果將有重要作用。
近幾年隨著人工智能領域的突破,人工智能行業逐漸滲入到生產生活中,通過語音控制汽車和機器生產設備越來越普遍,同時基于聲紋識別領域的密碼鎖功能在汽車鎖和機器鎖等領域也越來越受到重視,本發明意圖就是實現機器上的語音鎖功能,每個人都有特定的語音,對人的聲紋特性進行建模,只有具有權限的聲紋特征才能通過權限訪問和操作機器,這便實現了人工智能操控機器的功能。
聲紋識別整體流程分為,語音預處理階段,語音特征提取階段,語音模型建立階段和語音識別階段,如上述,重點是語音預處理和模型建立階段,語音易受背景噪音干擾,因此一個好的預處理過程顯得尤為重要,而選擇和改進合理的模型進行建模也是提升識別率的重要因素。
發明內容
本發明的目的是從背景噪音和模型訓練方式兩個方面入手,構建語音模型系統,使得系統在真實的環境下(比如工廠車間等環境)能有更高的識別率。
為了完成上述目的,本發明通過下面的技術方案進行實施。
復雜噪音下的聲紋識別系統,其特征在于包含不同背景噪音下的語音采集模塊,背景噪音區分模塊,背景噪音濾除模塊,語音端點檢測模塊,語音MFCC特征提取模塊,VQ多模型訓練模塊,語音識別判斷命令詞模塊,說話人判別模塊。
作為本發明的優選方案,所述不同背景噪音下的語音采集模塊將在非平穩背景噪音,強平穩背景噪音和弱平穩背景噪音3種背景噪音下進行說話人的語音采集,采集方式是每個語音文件只包含一個命令詞,但重復錄制多遍的方式,所述語音端點檢測模塊采用短時能量和短時過零率進行語音端點檢測,所述語音識別判斷命令詞模塊采用語音識別技術識別出說話人的命令詞內容,然后與相應的VQ模型進行匹配。
作為本發明的優選方案,背景噪音區分模塊,本發明首先將背景噪音分為3種,分別為非平穩背景噪音,強平穩背景噪音和弱平穩背景噪音,這里非平穩和平穩是通過人為閾值設置然后進行區分的,強和弱的概念也如此,具體閾值的設置是通過大量的實驗完成的。平穩背景噪音與非平穩背景噪音的區分采用了熵譜檢測來完成,通過對背景噪音計算熵譜值,如果達到某個閾值則認為是平穩背景噪音,否則認為是非平穩的。而對于強平穩背景噪音和弱平穩背景噪音則采用了信噪比來進行區分,同樣,如果超過某個閾值則認為是強噪音,否則為弱平穩噪音。
作為本發明的優選方案,所述背景噪音濾除模塊,采用譜減法濾除背景噪音。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于張學陽,未經張學陽許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201611231657.4/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種聲紋識別方法
- 下一篇:一種純語音快速篩選方法及其裝置





