[發明專利]一種基于多人說話的聲紋識別方法在審
| 申請號: | 201610024134.6 | 申請日: | 2016-01-14 |
| 公開(公告)號: | CN106971737A | 公開(公告)日: | 2017-07-21 |
| 發明(設計)人: | 祝銘明 | 申請(專利權)人: | 芋頭科技(杭州)有限公司 |
| 主分類號: | G10L17/08 | 分類號: | G10L17/08;G10L17/14 |
| 代理公司: | 上海申新律師事務所31272 | 代理人: | 黨蕾 |
| 地址: | 310000 浙江省杭州市余杭區*** | 國省代碼: | 浙江;33 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 說話 聲紋 識別 方法 | ||
技術領域
本發明涉及生物識別技術領域,尤其涉及一種基于多人說話的聲紋識別方法。
背景技術
聲紋識別和指紋,虹膜,人臉識別等一樣,屬于生物識別的一種,被認為是最自然的生物特征識別身份鑒定方式。依靠聲紋識別可以很方便地對說話人的身份進行驗證,并且這種驗證方式的私密性非常高,因為聲紋通常無法被惡意復制和盜取,因此聲紋識別在各種領域尤其是智能設備領域具有突出的應用優勢。
聲紋識別的基本過程為語音采集,特征提取,分類模型。常見的語音特征提取方法是利用語音的短時平穩特性,采用美倒譜變換方法將語音轉換為識別特征集,之后經過學習過程對說話人語音進行建模得到說話人的分類模型,隨后通過各類識別模型獲得聲紋識別的結果。但是上述過程存在以下幾個問題:(1)上述聲紋識別的模型需要學習更多的樣本才能應用;(2)依據上述識別模型進行的聲紋識別的計算的復雜度較高;(3)依據上述的識別模型計算得到的模型數據量較大;(4)當多個說話人同時說話時,無法辨別出需要識別的說話人的語音。綜上所述,對于資源有限的智能系統而言,上述既存的問題限制了現有技術中的聲紋識別算法的應用。
發明內容
根據現有技術中存在的上述問題,現提供一種基于多人說話的聲紋識別方法的技術方案,具體包括:
一種基于多人說話的聲紋識別方法,其中:預設一第一頻段以及一第二頻段,所述第一頻段高于所述第二頻段,包括下述步驟:
步驟S1,接收多個說話人的聲源;
步驟S2,對所述聲源進行分解,以分別獲取每個人的語音;
步驟S3,將每個人的所述語音均與所述第一頻段進行匹配,以獲取相應的匹配關聯度,或者
將每個人的所述語音均與所述第二頻段進行匹配,以獲取相應的匹配關聯度;
步驟S4,提取最大的所述匹配關聯度對應的所述語音,將所述語音與所述第一頻段或者所述第二頻段進行擬合;
步驟S5,將分別處于所述第一頻段或者所述第二頻段下的不同背景、不同人聲的語音分割為特定長度的識別區段;
步驟S6,對每個所述識別區段做特征變換后得到相應的多個識別特征,并采用關聯于所有所述識別區段的所有所述識別特征分別構成對應所述第一頻段的識別特征空間,或者對應所述第二頻段的所述識別特征空間;
步驟S7,將所述識別特征空間劃分成復數個子空間,并以描述信息每個被劃分的所述子空間,以及分別對每個所述子空間賦予一對應的序號;
步驟S8,分別將處于所述第一頻段或者處于所述第二頻段的關聯于訓練模型的每條訓練語句做特征變換后得到包括相應的時序特征點的時序特征點集,每個所述時序特征點分別被分配入同頻段下的各個所述子空間,根據每個所述時序特征點對應的所述子空間的序號分別形成關聯于所述第一頻段或者所述第二頻段的第一序列,并進而形成對應的訓練識別特征;
步驟S9,分別將處于所述第一頻段或者處于所述第二頻段的關聯于測試模型的每條測試語句做特征變換后得到所述時序特征點集,每個所述時序特征點分別被分配入各個所述子空間,根據每個所述時序特征點對應的所述子空間的序號分別形成關聯于所述第一頻段或者所述第二頻段的第二序列,并進而形成對應的測試識別特征;
步驟S10,對比關聯于所述第一頻段的所述訓練識別特征與所述測試識別特征是否相似,并根據對比結果處理得到基于多人說話的聲紋識別的確認結果,或者
對于關聯于所述第二頻段的所述訓練識別特征與所述測試識別特征是否相似,并根據對比結果處理得到基于多人說話的聲紋識別的確認結果。
優選的,該基于多人說話的聲紋識別方法,其中,所述步驟S8中,每個 所述時序特征點按照最近鄰原則被分配入各個所述子空間內。
優選的,該基于多人說話的聲紋識別方法,其中,所述步驟S8中,將被分配入所述時序特征點的各個所述子空間按照所述序號組成一空間序列,并將所述空間序列作為所述第一序列,以形成所述訓練識別特征。
優選的,該基于多人說話的聲紋識別方法,其中,所述步驟S9中,將被分配入所述時序特征點的各個所述子空間按照所述序號組成一空間序列,并將所述控件序列作為所述第二序列,以形成所述測試識別特征。
優選的,該基于多人說話的聲紋識別方法,其中,所述步驟S8中,所述空間序列中包括關聯于每個所述子空間的數據組,一個所述數據組對應一個所述序號;
在形成所述空間序列后,還包括分別對處于所述第一頻段或者所述第二頻段的所述空間序列進行的第一數據壓縮的過程,具體為:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于芋頭科技(杭州)有限公司,未經芋頭科技(杭州)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201610024134.6/2.html,轉載請聲明來源鉆瓜專利網。





