[發明專利]聲紋識別方法、聲紋驗證方法、裝置、計算設備及介質在審
| 申請號: | 201811382285.4 | 申請日: | 2018-11-20 |
| 公開(公告)號: | CN111199741A | 公開(公告)日: | 2020-05-26 |
| 發明(設計)人: | 卓著;趙情恩;雷赟 | 申請(專利權)人: | 阿里巴巴集團控股有限公司 |
| 主分類號: | G10L17/02 | 分類號: | G10L17/02;G10L17/18;G10L21/0208;G10L21/0272;G10L25/24;G10L25/93 |
| 代理公司: | 北京思睿峰知識產權代理有限公司 11396 | 代理人: | 殷晴青;謝建云 |
| 地址: | 開曼群島大開曼*** | 國省代碼: | 暫無信息 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 聲紋 識別 方法 驗證 裝置 計算 設備 介質 | ||
1.一種聲紋識別方法,包括:
對待驗證的語音信號進行噪聲分離處理,以獲取第一語音信號和第二語音信號;
分別對第一語音信號和第二語音信號進行聲紋識別。
2.如權利要求1所述的方法,其中,所述對待驗證的語音信號進行噪聲分離處理,以獲取第一語音信號和第二語音信號,包括:
將待驗證的語音信號分離成多個語音信號分量;
對所述多個語音信號分量進行聲源聚類,以獲取第一語音信號和第二語音信號。
3.如權利要求2所述的方法,其中,所述將待驗證的語音信號分離成多個語音信號分量包括:
對待驗證的語音信號進行端點檢測,以獲取一個或多個非靜音語音信號;
對各非靜音語音信號,提取所述非靜音語音信號的語音特征參數,并基于所述語音特征參數對所述非靜音語音信號進行分離,以獲取對應的多個語音信號分量。
4.如權利要求3所述的方法,其中,所述語音特征參數包括梅爾頻率倒譜系數。
5.如權利要求4所述的方法,其中,所述提取所述非靜音語音信號的語音特征參數包括:
對所述非靜音語音信號進行分幀加窗處理,以生成對應的多個語音幀;
計算各語音幀的離散功率譜,通過預設的三角帶通濾波器組對所述離散功率譜進行濾波,得到對應的系數集合;
利用離散余弦變換對所述系數集合進行處理,以生成所述語音幀的梅爾頻率倒譜系數。
6.如權利要求3所述的方法,其中,所述基于所述語音特征參數對所述非靜音語音信號進行分離,以獲取對應的多個語音信號分量包括:
對所述非靜音語音信號包括的多個語音幀,根據所述語音特征參數,計算相鄰語音幀之間的特征距離;
基于預設的第一距離準則和所述特征距離,確定相鄰語音幀是否來源于同一聲源;
將來源于同一聲源的相鄰語音幀進行合并,以形成對應的語音信號分量。
7.如權利要求2所述的方法,其中,所述對所述多個語音信號分量進行聲源聚類,以獲取第一語音信號和第二語音信號包括:
根據預設的第二距離準則,連續地合并所述多個語音信號分量中最相鄰的兩個語音信號分量,以聚類生成第一語音信號和第二語音信號。
8.如權利要求1所述的方法,其中,所述分別對第一語音信號和第二語音信號進行聲紋識別包括:
將第一語音信號進行預處理,以獲取所述第一語音信號對應的多個第一語音幀;
計算各第一語音幀的語音特征參數,基于所述語音特征參數確定所述第一語音信號的聲紋特征;
根據所述第一語音信號的聲紋特征,對所述第一語音信號進行評分,以確定第一語音信號分值。
9.如權利要求1所述的方法,其中,所述分別對第一語音信號和第二語音信號進行聲紋識別包括:
將第二語音信號進行預處理,以獲取所述第二語音信號對應的多個第二語音幀;
計算各第二語音幀的語音特征參數,基于所述語音特征參數確定所述第二語音信號的聲紋特征;
根據所述第二語音信號的聲紋特征,對所述第二語音信號進行評分,以確定第二語音信號分值。
10.如權利要求1所述的方法,其中,還包括:
根據聲紋識別的結果確定所述語音信號是否驗證成功。
11.如權利要求10所述的方法,其中,所述聲紋識別的結果包括第一語音信號分值和第二語音信號分值,所述根據聲紋識別的結果確定所述語音信號是否驗證成功包括:
將第一語音信號分值和第二語音信號分值中的較大值,作為所述語音信號的分值;
若所述分值超過預設的分值閾值,則確定所述語音信號驗證成功。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于阿里巴巴集團控股有限公司,未經阿里巴巴集團控股有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811382285.4/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:延遲安全電路
- 下一篇:一種光伏節能裝置的應用





