[發明專利]一種基于聲紋和語音的防錄音假冒身份識別方法及系統無效

申請號：	201210172697.1	申請日：	2012-05-30
公開（公告）號：	CN102708867A	公開（公告）日：	2012-10-03
發明（設計）人：	成波	申請（專利權）人：	北京正鷹科技有限責任公司
主分類號：	G10L17/00	分類號：	G10L17/00;G10L15/28
代理公司：	暫無信息	代理人：	暫無信息
地址：	100085 北京市海淀區***	國省代碼：	北京;11
權利要求書：	查看更多	說明書：	查看更多
摘要：
搜索關鍵詞：	一種基于聲紋語音錄音假冒身份識別方法系統
鉆瓜網技術展會專利詞庫專利權人專利榜在售專利公布日期熱門專利

【說明書】：

技術領域

本發明屬于計算機及信息服務技術領域，特別涉及通過語音中的人類的聲紋信息和語音內容對其聲稱的身份進行識別的方法及系統。

背景技術

聲紋識別技術

聲紋識別(Voiceprint?Recognition，VPR)技術屬于生物識別技術的一種，是一項根據語音中反映說話人生理和行為特征的語音參數，來識別語音話者身份的技術。由于每個人的發聲器官(舌、牙齒、喉頭、肺、鼻腔)在尺寸和形態方面不盡相同，因此聲紋也就成為一種鑒別說話人身份的識別手段。

聲紋識別系統是以說話人的語音作為輸入，用訓練得到的特定人聲紋模型來識別待測語音的話者身份。聲紋識別系統一般包括兩個步驟：聲紋建模(Voiceprint?Modeling)和聲紋驗證(Voiceprint?Verification)。聲紋識別系統在實際應用時，常常會面臨一個兩難選擇問題，即如何確定聲紋識別系統的錯誤拒絕率和錯誤接受率。錯誤拒絕率是指拒絕合法說話人而造成的錯誤，錯誤接受率是指接受非法說話人而造成的錯誤，二者與閾值的設定相關。在實際應用環境下，兩者無法同時達到最小，需要調整系統閾值來滿足不同應用的需求。例如在強調“易用性”的情況下，可以讓錯誤拒絕率低一些，此時錯誤接受率會增加，從而導致安全性有所降低；在強調“安全性”的情況下，可以讓錯誤接受率低一些，此時錯誤拒絕率會增加，從而導致系統的易用性有所降低。前者可以概括為“寧錯勿漏”，而后者則是“寧漏勿錯”。通常，系統的閾值會在開發前根據實際環境的語音調優得到，在系統投入實際應用后，還需要根據實際數據再做一下調整，以便更好的貼近實際情況。

聲紋識別技術有著非常廣闊的應用前景：

(1)它可以作為個人身份核查和安全檢查的一種手段；

(2)它可以作為特定人群的一種識別手段；

(3)它可以作為一種同一說話人的鑒別手段。

在現有技術中，聲紋識別方法包括聲紋建模和聲紋驗證兩個部分。

其中，聲紋建模方法的流程，如圖1(a)所示，包括以下步驟：

采集用戶語音并提取聲紋特征；

基于提取出的聲紋特征，訓練聲紋模型，即建立該用戶的聲紋模型；聲紋建模時用到的方法可采用任何已有的方法(如MAP、MLLR、EigenVoice等)。

聲紋驗證方法的流程如圖1(b)所示，包括以下步驟：

從采集的待識別語音中提取聲紋特征；

讀取指定的待比對聲紋模型；

將提取出的聲紋特征，與讀取的聲紋模型進行匹配比較(如計算概率似然得分等)，得到匹配得分Score；

將匹配得分Score與系統設定的閾值相比對，如果大于閾值，則聲紋驗證成功，認為待識別語音的話者身份與指定的聲紋模型對應的話者身份相同，是同一個說話人，結束；否則，聲紋驗證失敗，認為待識別語音的話者身份與指定的聲紋模型對應的話者身份不相同，是不同的說話人，結束。

所述的閾值是指，在大量的聲紋識別測試的匹配得分Score中，得到的一個參考值。該值用于界定待識別語音與指定的聲紋模型是否出自同一個說話人。

語音識別技術

ASR是自動語音識別(Automatic?Speech?Recognition)的縮寫，是一種讓計算機通過識別和理解過程把語音信號轉變為相應的文本或命令的技術，即“音”到“字”的轉換。語音識別按照任務種類和應用可以分為：(1)孤立詞識別(Isolated?Word?Recognition)，或命令詞識別。它的任務是識別事先已知的命令詞，如“開機”、“關機”等；(2)關鍵詞識別或關鍵詞檢出(Keyword?Spotting)。它的任務不是識別全部的文字，而是檢測語音信號中是否出現預設詞表里的關鍵詞，如在語音中檢測是否出現“計算機”這個詞；(3)連續語音識別。它的任務是識別語音中的全部文字。

語音識別的應用領域非常廣泛，常見的應用系統有：(1)語音輸入系統，相對于鍵盤輸入方法，它更符合人的日常習慣，也更自然、更高效；(2)語音控制系統，即用語音來控制設備的運行，相對于手動控制來說更加快捷、方便，可以用在諸如工業控制、語音撥號系統、智能家電、聲控智能玩具等許多領域；(3)智能對話查詢系統，根據客戶的語音進行操作，為用戶提供自然、友好的數據庫檢索服務，例如家庭服務、賓館服務、旅行社服務系統、訂票系統、醫療服務、銀行服務、股票查詢服務等等。

已有的語音識別方法的應用流程如圖2所示，包括以下步驟：

采集用戶的語音并提取聲學特征；

下載完整專利技術內容需要扣除積分，VIP會員可以免費下載。

免登錄下載普通用戶下載升級VIP會員，免費下載

該專利技術資料僅供研究查看技術是否侵權等信息，商用須獲得專利權人授權。該專利全部權利屬于北京正鷹科技有限責任公司，未經北京正鷹科技有限責任公司許可，擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作，請聯系【客服】

本文鏈接：http://www.szxzyx.cn/pat/books/201210172697.1/2.html，轉載請聲明來源鉆瓜專利網。