[發明專利]基于UBM和SVM的說話人身份識別系統在審
| 申請號: | 201710302853.4 | 申請日: | 2017-05-02 |
| 公開(公告)號: | CN108806697A | 公開(公告)日: | 2018-11-13 |
| 發明(設計)人: | 申子健;徐波;陳愛月 | 申請(專利權)人: | 申子健 |
| 主分類號: | G10L17/14 | 分類號: | G10L17/14;G10L17/04 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 210046 江蘇省*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 身份識別系統 特征向量提取 語音格式轉換 測試語音 得分計算 計算環境 開發環境 訓練語音 語音信號 向量機 匹配 身份 應用 | ||
基于UBM和SVM的說話人身份識別系統。系統包括:語音格式轉換,目的是將原始的語音信號轉為適合開發環境的格式;均值特征向量提取系統,目的是便于應用于SVM的計算環境;向量機得分計算系統,主要功能是完成測試語音和訓練語音的匹配,從而確定說話人的身份。
技術領域
本發明涉及到不基于文本的說話人身份識別。
背景技術
近年來,各種身份識別方式層出不窮,常見的有人臉識別、指紋識別、語音識別等,這些都是為了識別身份,所謂身份識別技術,就是建立在一定的科技手段上,利用一些模型、算法,并借助于高端設備對人的身份進行鑒定識別。
手機的屏幕解鎖采用指紋識別,登錄支付寶賬戶采用人臉識別,但不管是哪一種識別技術,都不能保證百分之百的準確率,只能通過不斷提高科技手段,算法復雜度,來提高識別準確率。說話人身份識別就是基于語音識別的技術,識別說話人身份。
與文本無關的說話人身份識別已經從基于高斯混合模型(GMM)的方式變為利用i-voctor特征參數來進行研究的方式,可以把這種變化看成是從概率模型計算到高維向量的轉變。
在研究GMM模型的過程中,我們對采集的語音信號進行特征提取,計算中使用的主要算法包括極大似然估計算法(EM),用于求取通用背景模型(UBM)的GMM,還有最大后驗準則(MAP)的方式,用于求取說話人的GMM,最后用后驗概率計算說話人得分,該方法又稱為GMM-UBM。
對于語音信號,我們的前段處理主要包含兩個部分,分別為求取Mel倒譜系數,以及進行HTK封裝。目的是將模擬語音信號轉為數字信號,為后續的識別過程做基礎。
極大似然估計算法(EM)是另外一種求估計的方法,首先由德國數學家C.F.Gauss(高斯)在1821年提出,但這個方法通常被歸功于英國的統計學家R.A.Fisher(羅納德·費希爾),他在1922年的論文On the mathematical foundations of theoreticalstatistics,reprinted in Contributions to Mathematical Statistics(byR.A.Fisher),1950,J.Wiley&Sons,New York中再次提出了這個思想,并且首先探討了這種方法的一些性質,極大似然估計這一名稱也是
通用背景模型(UBM)是由大量的冒認者語音使用EM算法訓練得到的,因為UBM模型的訓練來自大量不同的說話人,因而可以認為UBM模型是一個與任何一個單獨的說話人都無關的模型。
最大后驗準則算法(MAP)可以看成是在EM算法的基礎上利用UBM模型完成對少量語音的GMM求解,在語音識別領域應用廣泛,當我們采集同一個說話人的少量語音數據后,就可求出這些語音的GMM參數。Mel倒譜系數Mel-scaled Cepstrum Coefficients(MFCC)的目的是模擬人的聽覺系統來描繪語音信號的特征,主要步驟有預加重,分幀加窗處理,各幀信號的FFT變換以及濾波等步驟。
HTK格式主要是針對語言文件和語音標簽數據文件的處理,是在工程中建立隱性馬爾科夫模型(HMMS)的工具,比較適合在基于GMM的識別中使用,同時在MATLAB的研究環境下配有voicebox工具箱來進行格式轉換。
發明內容
本發明的至少一個目的在于提供一種說話人身份識別的計算方式,至少能克服上述現有技術的缺點和不足,以提高說話人身份識別的準確度。
本發明的一個實施例是一種說話人身份識別的算法系統,可以在計算機上進行仿真實,包括語音數據輸入部分,將輸入的語音轉為標準的HTK格式。還包括識別過程,能夠將語音庫的說話人和外部輸入的測試語音進行識別,可以提高對庫中說話人的識別精度。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于申子健,未經申子健許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710302853.4/2.html,轉載請聲明來源鉆瓜專利網。





