[發明專利]聲紋識別方法、聲紋驗證方法、裝置、計算設備及介質在審

申請號：	201811382285.4	申請日：	2018-11-20
公開（公告）號：	CN111199741A	公開（公告）日：	2020-05-26
發明（設計）人：	卓著;趙情恩;雷赟	申請（專利權）人：	阿里巴巴集團控股有限公司
主分類號：	G10L17/02	分類號：	G10L17/02;G10L17/18;G10L21/0208;G10L21/0272;G10L25/24;G10L25/93
代理公司：	北京思睿峰知識產權代理有限公司 11396	代理人：	殷晴青;謝建云
地址：	開曼群島大開曼***	國省代碼：	暫無信息
權利要求書：	查看更多	說明書：	查看更多
摘要：
搜索關鍵詞：	聲紋識別方法驗證裝置計算設備介質
鉆瓜網技術展會專利詞庫專利權人專利榜在售專利公布日期熱門專利

【權利要求書】：

1.一種聲紋識別方法，包括：

對待驗證的語音信號進行噪聲分離處理，以獲取第一語音信號和第二語音信號；

分別對第一語音信號和第二語音信號進行聲紋識別。

2.如權利要求1所述的方法，其中，所述對待驗證的語音信號進行噪聲分離處理，以獲取第一語音信號和第二語音信號，包括：

將待驗證的語音信號分離成多個語音信號分量；

對所述多個語音信號分量進行聲源聚類，以獲取第一語音信號和第二語音信號。

3.如權利要求2所述的方法，其中，所述將待驗證的語音信號分離成多個語音信號分量包括：

對待驗證的語音信號進行端點檢測，以獲取一個或多個非靜音語音信號；

對各非靜音語音信號，提取所述非靜音語音信號的語音特征參數，并基于所述語音特征參數對所述非靜音語音信號進行分離，以獲取對應的多個語音信號分量。

4.如權利要求3所述的方法，其中，所述語音特征參數包括梅爾頻率倒譜系數。

5.如權利要求4所述的方法，其中，所述提取所述非靜音語音信號的語音特征參數包括：

對所述非靜音語音信號進行分幀加窗處理，以生成對應的多個語音幀；

計算各語音幀的離散功率譜，通過預設的三角帶通濾波器組對所述離散功率譜進行濾波，得到對應的系數集合；

利用離散余弦變換對所述系數集合進行處理，以生成所述語音幀的梅爾頻率倒譜系數。

6.如權利要求3所述的方法，其中，所述基于所述語音特征參數對所述非靜音語音信號進行分離，以獲取對應的多個語音信號分量包括：

對所述非靜音語音信號包括的多個語音幀，根據所述語音特征參數，計算相鄰語音幀之間的特征距離；

基于預設的第一距離準則和所述特征距離，確定相鄰語音幀是否來源于同一聲源；

將來源于同一聲源的相鄰語音幀進行合并，以形成對應的語音信號分量。

7.如權利要求2所述的方法，其中，所述對所述多個語音信號分量進行聲源聚類，以獲取第一語音信號和第二語音信號包括：

根據預設的第二距離準則，連續地合并所述多個語音信號分量中最相鄰的兩個語音信號分量，以聚類生成第一語音信號和第二語音信號。

8.如權利要求1所述的方法，其中，所述分別對第一語音信號和第二語音信號進行聲紋識別包括：

將第一語音信號進行預處理，以獲取所述第一語音信號對應的多個第一語音幀；

計算各第一語音幀的語音特征參數，基于所述語音特征參數確定所述第一語音信號的聲紋特征；

根據所述第一語音信號的聲紋特征，對所述第一語音信號進行評分，以確定第一語音信號分值。

9.如權利要求1所述的方法，其中，所述分別對第一語音信號和第二語音信號進行聲紋識別包括：

將第二語音信號進行預處理，以獲取所述第二語音信號對應的多個第二語音幀；

計算各第二語音幀的語音特征參數，基于所述語音特征參數確定所述第二語音信號的聲紋特征；

根據所述第二語音信號的聲紋特征，對所述第二語音信號進行評分，以確定第二語音信號分值。

10.如權利要求1所述的方法，其中，還包括：

根據聲紋識別的結果確定所述語音信號是否驗證成功。

11.如權利要求10所述的方法，其中，所述聲紋識別的結果包括第一語音信號分值和第二語音信號分值，所述根據聲紋識別的結果確定所述語音信號是否驗證成功包括：

將第一語音信號分值和第二語音信號分值中的較大值，作為所述語音信號的分值；

若所述分值超過預設的分值閾值，則確定所述語音信號驗證成功。

下載完整專利技術內容需要扣除積分，VIP會員可以免費下載。

免登錄下載普通用戶下載升級VIP會員，免費下載

該專利技術資料僅供研究查看技術是否侵權等信息，商用須獲得專利權人授權。該專利全部權利屬于阿里巴巴集團控股有限公司，未經阿里巴巴集團控股有限公司許可，擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作，請聯系【客服】

本文鏈接：http://www.szxzyx.cn/pat/books/201811382285.4/1.html，轉載請聲明來源鉆瓜專利網。

同類專利

專利分類

G 物理

G10 樂器；聲學
G10L 語音分析或合成；語音識別；音頻分析或處理
G10L17-00 講話者辨認或驗證

免登錄下載普通用戶下載升級VIP會員，免費下載

專利文獻下載

說明：

1、專利原文基于中國國家知識產權局專利說明書；

2、支持發明專利、實用新型專利、外觀設計專利（升級中）；

3、專利數據每周兩次同步更新，支持Adobe PDF格式；

4、內容包括專利技術的結構示意圖、流程工藝圖或技術構造圖；

5、已全新升級為極速版,下載速度顯著提升！歡迎使用！

請您登陸后，進行下載，點擊【登陸】【注冊】