[發明專利]一種自適應的基于碼本的聲紋識別方法及系統在審

申請號：	201610024241.9	申請日：	2016-01-14
公開（公告）號：	CN106971726A	公開（公告）日：	2017-07-21
發明（設計）人：	祝銘明	申請（專利權）人：	芋頭科技（杭州）有限公司
主分類號：	G10L17/02	分類號：	G10L17/02;G10L17/04;G10L19/032;G10L19/09;G10L25/18
代理公司：	上海申新律師事務所31272	代理人：	黨蕾
地址：	310000 浙江省杭州市余杭區***	國省代碼：	浙江;33
權利要求書：	查看更多	說明書：	查看更多
摘要：
搜索關鍵詞：	一種自適應基于聲紋識別方法系統
鉆瓜網技術展會專利詞庫專利權人專利榜在售專利公布日期熱門專利

【說明書】：

技術領域

本發明屬于語音信號處理領域，尤其涉及一種自適應的基于碼本的聲紋識別方法及系統。

背景技術

家用服務機器人是當今前沿高技術研究最活躍的領域之一，它可以完成有益于人類的服務工作，如提供家務、娛樂休閑、教育、安全監控等服務，擁有廣泛的潛在客戶群體與市場，現有的家用服務機器人廣泛采用語音識別技術實現人機交互，讓機器人能夠聽懂人類語音，以執行相應動作，然而，現有的機器人尚無法準確識別說話人身份，無法滿足用戶個性化的需求。隨著計算機技術和數字信號處理理論的發展出現的聲紋識別技術，通過從說話人的一段語音中，提取出反映該說話人生理、心理的語音特征參數，通過對語音特征參數進行分析建模與模式匹配，來實現辨認或確認未知說話人身份的目的。然而，現有的聲紋識別系統往往是針對一特定的應用場景進行設計，當系統的應用場景發生改變時，自適應能力不強，無法實現人機自由交流，且由于聲紋識別的速度過慢，造成用戶體驗差，這是本領域技術人員所不期望看到的。

發明內容

為解決以上技術問題，提供一種自適應的基于碼本的聲紋識別方法及系統，解決現有識別方法的缺陷。

具體技術方案如下：

一種自適應的基于碼本的聲紋識別方法，其中，應用于家用機器人，具體工作步驟包括：

S1：采集語音信號；

S2：對所述語音信號進行預處理；

S3：自所述預處理后的語音信號中提取語音特征參數，所述語音特征參數包括線性預測得到的第一類特征參數及模擬人耳對聲音頻率的感知特性而提取的第二類特征參數；

S4：為每一個家庭成員建立一個碼本存儲在語音數據庫中作為所述家庭成員的語音模板，所述家庭成員的所有碼本構成一聲學模型；

S5：在一預定時間內對所述聲學模型中的訓練語句的使用頻率進行統計，并根據統計結果以碼本為單位將所述聲學模型區分為第一聲學模型和第二聲學模型，所述第一聲學模型的中碼本的使用頻率大于所述第二聲學模型，并在通電時將所述第一聲學模型加載至緩存中；

S6：依據所述第一聲學模型和第二聲學模型對待測語音信號進行模式匹配，獲取識別結果。

上述的自適應的基于碼本的聲紋識別方法，所述步驟S2中，所述預處理的步驟依次包括：

步驟S21，對所述預處理后的語音信號進行采樣和量化以獲得數字語音信號；

步驟S22，所述數字語音信號通過一濾波器組以提升所述數字信號的高頻成分；

步驟S23，對步驟S22得到的語音信號進行分幀與加窗，獲得加窗后的語音信號。

上述的自適應的基于碼本的聲紋識別方法，所述步驟S3中提取所述第一類特征參數為線性預測系數，提取步驟如下：

步驟S31a，定義短時語音信號和誤差信號；

步驟S32a，計算所述短時語音信號和所述誤差信號的誤差平方和；

步驟S33a，對所述誤差平方和求導數，并求解方程組獲得所述第一類特征參數。

上述的自適應的基于碼本的聲紋識別方法，所述步驟S3中提取所述第二類特征參數的步驟包括：

步驟S31b，對所述預處理后的語音信號進行傅里葉變換得到線性頻譜；

步驟S32b，對所述線性頻譜通過一三角形帶通濾波器組得到相應的梅爾頻譜；

步驟S33b，計算所述梅爾頻譜的對數頻譜；

步驟S34b，對所述對數頻譜進行離散余弦變換得到第二類特征參數。

上述的自適應的基于碼本的聲紋識別方法，所述步驟S4的具體步驟如下：

步驟S41，自所述語音信號中提取N個特征矢量，通過聚類法對所述特征矢量進行歸類得到M個碼本；

步驟S42，得到每個類對應的碼本矢量；

步驟S43，建立每一個家庭成員的碼本矢量的集合構成聲學模型。

上述的自適應的基于碼本的聲紋識別方法，所述步驟S6具體如下，

步驟S61，將待識別的語音信號依次與所述第一聲學模型和第二聲學模型作相似性匹配，并根據加權歐式距離測度進行判斷；

步驟S62，選取適當的距離度量作為門限值；

步驟S63，滿足門限值范圍內的結果作為識別結果。

還提供，一種自適應的基于碼本的聲紋識別系統，包括

語音輸入模塊，用于捕獲語音信號；

預處理模塊，與所述語音輸入模塊連接，用于對所述語音信號進行預處理；

第一特征參數提取模塊，與所述預處理模塊連接，用于獲取所述語音信號中的第一特征參數；

下載完整專利技術內容需要扣除積分，VIP會員可以免費下載。

免登錄下載普通用戶下載升級VIP會員，免費下載

該專利技術資料僅供研究查看技術是否侵權等信息，商用須獲得專利權人授權。該專利全部權利屬于芋頭科技（杭州）有限公司，未經芋頭科技（杭州）有限公司許可，擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作，請聯系【客服】

本文鏈接：http://www.szxzyx.cn/pat/books/201610024241.9/2.html，轉載請聲明來源鉆瓜專利網。

同類專利

專利分類

G 物理

G10 樂器；聲學
G10L 語音分析或合成；語音識別；音頻分析或處理
G10L17-00 講話者辨認或驗證

免登錄下載普通用戶下載升級VIP會員，免費下載

專利文獻下載

說明：

1、專利原文基于中國國家知識產權局專利說明書；

2、支持發明專利、實用新型專利、外觀設計專利（升級中）；

3、專利數據每周兩次同步更新，支持Adobe PDF格式；

4、內容包括專利技術的結構示意圖、流程工藝圖或技術構造圖；

5、已全新升級為極速版,下載速度顯著提升！歡迎使用！

請您登陸后，進行下載，點擊【登陸】【注冊】