[發明專利]說話人識別方法和系統無效

申請號：	200810246575.6	申請日：	2008-12-25
公開（公告）號：	CN101436405A	公開（公告）日：	2009-05-20
發明（設計）人：	張晨;馮宇紅;鄧昊	申請（專利權）人：	北京中星微電子有限公司
主分類號：	G10L17/00	分類號：	G10L17/00
代理公司：	北京國昊天誠知識產權代理有限公司	代理人：	顧惠忠
地址：	100083北京市***	國省代碼：	北京;11
權利要求書：	查看更多	說明書：	查看更多
摘要：
搜索關鍵詞：	說話識別方法系統
鉆瓜網技術展會專利詞庫專利權人專利榜在售專利公布日期熱門專利

【說明書】：

技術領域

本發明涉及生物特征識別領域，特別地，涉及一種說話人識別方法和系統。

背景技術

說話人識別(Speaker?Recognition)，是一項根據語音波形中反映說話人生理和行為特征的語音參數，自動識別說話人身份的技術。說話人識別可以看作是語音識別的一種。它和語音識別一樣，都是通過對所收到的語音信號進行處理，提取相應的特征或者建立相應的模型，然后據此做出判斷。說話人識別與語音識別的區別在于，它并不注意語音信號中的語義內容，而是希望從語音信號中提取出人的特征；而語音識別是企求從不同人的詞語信號中尋找共同因素，對不同人說話的差別加以歸一化。

圖1示出了現有技術中說話人識別系統的結構框圖，建立和應用這一系統可分為兩個階段，即訓練階段和識別階段。在訓練階段，系統為參考語音信號建立模板，而在識別階段，系統將待識別的語音信號特征與參考模板特征進行比較，并且根據一定的相似性準則形成判斷。

現有的說話人識別又可以分為與文本有關的和與文本無關的兩種方式，兩種方式都是根據語音信號中體現的說話人特征進行說話人識別。“與文本無關”，是采用隨機說話文本內容，但是這種方法需要訓練數據足夠充足，而在實際應用中，這點往往不能得到滿足，因此應用較少。“與文本有關”，則是采用受限的說話文本內容，需要說話的人配合，按規定的文本發音或者按提示發音，識別系統對說話人語音信號中一種或幾種特征參量進行識別。但是，當出現假冒者刻意模仿真實用戶的發音特征時，識別系統會產生一定的判斷誤差，將假冒者誤認為是真實用戶。

針對這種情況，關鍵的問題是找到一種能夠可靠、有效識別說話人的方法和系統。

發明內容

本發明所要解決的技術問題是提供一種說話人識別方法和系統，能夠穩定和可靠地識別說話人，并提高識別率。

為了解決上述問題，本發明公開了一種說話人識別的方法，所述方法包括以下步驟：

獲取待識別說話人的語音信號；

提取所述語音信號中的基音特征參量、倒譜特征參量及功率譜特征參量；

將所述基音特征參量、倒譜特征參量及功率譜特征參量與特征模板中預置的相應語音信號的特征參量分別進行匹配，獲取待識別語音信號的綜合匹配失真值及綜合匹配路徑偏差；

根據所述綜合匹配失真值及綜合匹配路徑偏差，獲取待識別語音信號的最終比對誤差；

如果所述最終比對誤差低于預設綜合匹配對比閾值，則確認該說話人。

優選的，所述待識別說話人的語音信號是說話人按照特征模板中預置文本內容發音的信號。

進一步，所述獲取待識別語音信號的綜合匹配失真值的步驟具體包括：

分別將各個待識別特征參量與特征模板中預置的相應語音信號的特征參量分別進行匹配，獲取各待識別特征參量的匹配失真值；

對各個待識別特征參量的匹配失真值進行加權，得到待識別語音信號的綜合匹配失真值。

進一步，所述獲取待識別語音信號的綜合匹配路徑偏差的步驟具體包括：

將特征模板中預置的語音信號變換成為預置數字語音信號采樣幀序列；

將待識別的語音信號按照相同的采樣間隔變換成為待識別數字語音信號采樣幀序列；

將待識別數字語音信號采樣幀序列中的各幀依次與預置數字語音信號采樣幀序列中的相應幀進行各個特征參量匹配，得到各個特征參量匹配路徑；

計算各個特征參量匹配路徑每二者之間的路徑偏差，獲取綜合匹配路徑偏差。

優選的，所述最終比對誤差是由所述綜合匹配失真值及綜合匹配路徑偏差之間的乘積得到。

根據本發明的實施例，還公開了一種說話人識別的系統，所述系統包括：

取樣模塊，用于獲取待識別說話人的語音信號；

提取特征模塊，用于提取所述待識別的語音信號中包含的基音特征參量、倒譜特征參量及功率譜特征參量；

匹配模塊，用于將將所述基音特征參量、倒譜特征參量及功率譜特征參量與特征模板中預置的相應語音信號的特征參量分別進行匹配，獲取待識別語音信號的綜合匹配失真值及綜合匹配路徑偏差；

最終比對誤差獲取模塊，用于根據所述綜合匹配失真值及綜合匹配路徑偏差，獲取待識別語音信號的最終比對誤差。

優選的，其特征在于，所述待識別說話人的語音信號是說話人按照特征模板中預置文本內容發音的信號。

所述匹配模塊進一步包括：

匹配失真子模塊，用于根據各個待識別特征參量的匹配失真值，得到待識別語音信號的綜合匹配失真值；

下載完整專利技術內容需要扣除積分，VIP會員可以免費下載。

免登錄下載普通用戶下載升級VIP會員，免費下載

該專利技術資料僅供研究查看技術是否侵權等信息，商用須獲得專利權人授權。該專利全部權利屬于北京中星微電子有限公司，未經北京中星微電子有限公司許可，擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作，請聯系【客服】

本文鏈接：http://www.szxzyx.cn/pat/books/200810246575.6/2.html，轉載請聲明來源鉆瓜專利網。

上一篇：止回閥
下一篇：一種自動防衛的通訊設備及其運行方法

同類專利

專利分類

G 物理

G10 樂器；聲學
G10L 語音分析或合成；語音識別；音頻分析或處理
G10L17-00 講話者辨認或驗證

免登錄下載普通用戶下載升級VIP會員，免費下載

專利文獻下載

說明：

1、專利原文基于中國國家知識產權局專利說明書；

2、支持發明專利、實用新型專利、外觀設計專利（升級中）；

3、專利數據每周兩次同步更新，支持Adobe PDF格式；

4、內容包括專利技術的結構示意圖、流程工藝圖或技術構造圖；

5、已全新升級為極速版,下載速度顯著提升！歡迎使用！

請您登陸后，進行下載，點擊【登陸】【注冊】