[發明專利]聲紋識別方法、聲紋驗證方法、裝置、計算設備及介質在審
| 申請號: | 201811382285.4 | 申請日: | 2018-11-20 |
| 公開(公告)號: | CN111199741A | 公開(公告)日: | 2020-05-26 |
| 發明(設計)人: | 卓著;趙情恩;雷赟 | 申請(專利權)人: | 阿里巴巴集團控股有限公司 |
| 主分類號: | G10L17/02 | 分類號: | G10L17/02;G10L17/18;G10L21/0208;G10L21/0272;G10L25/24;G10L25/93 |
| 代理公司: | 北京思睿峰知識產權代理有限公司 11396 | 代理人: | 殷晴青;謝建云 |
| 地址: | 開曼群島大開曼*** | 國省代碼: | 暫無信息 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 聲紋 識別 方法 驗證 裝置 計算 設備 介質 | ||
本發明公開了一種聲紋識別方法、聲紋驗證方法、裝置、計算設備及介質,聲紋識別方法包括:對待驗證的語音信號進行噪聲分離處理,以獲取第一語音信號和第二語音信號,分別對第一語音信號和第二語音信號進行聲紋識別。
技術領域
本發明涉及語音信號處理領域,特別涉及一種聲紋識別方法、聲紋驗證方法、裝置、計算設備及介質。
背景技術
聲紋識別(Voiceprint Recognition),又稱說話人識別,該技術是從說話人發出的語音信號中提取語音特征,并據此對說話人進行身份確認的生物識別技術。其中,聲紋是指人類語音中攜帶言語信息的聲波頻譜,同指紋一樣,具備獨特的生物學特征,具有身份識別的作用,不僅具有特定性,而且具有相對的穩定性。
但是,由于語音信號容易受噪聲、錄音設備、傳輸信道的影響,通過聲紋識別來進行身份核實也具有一定的風險。特別是客服場景下的聲紋核身系統,當通過電話語音進行用戶的身份核實時,用戶的語音信號很容易受到噪聲環境的影響,而對被噪聲污染的語音信號進行聲紋識別,會導致識別的準確度下降,由此得出的用戶身份認證結果并不夠可信。
現有的聲紋識別方案,雖然實現了文本無關聲紋識別,無需用戶針對特定文本發出相應的聲音信號,但在噪聲抵抗上的性能較差,且不是流式計算框架的聲紋系統,難以保證實時性。因此,需要提供一種新的聲紋識別方案來優化上述處理過程。
發明內容
為此,本發明提供一種聲紋識別及驗證方案,以力圖解決或者至少緩解上面存在的問題。
根據本發明的一個方面,提供一種聲紋識別方法,該方法包括如下步驟:首先,對待驗證的語音信號進行噪聲分離處理,以獲取第一語音信號和第二語音信號;分別對第一語音信號和第二語音信號進行聲紋識別。
可選地,在根據本發明的聲紋識別方法中,對待驗證的語音信號進行噪聲分離處理,以獲取第一語音信號和第二語音信號,包括:將待驗證的語音信號分離成多個語音信號分量;對多個語音信號分量進行聲源聚類,以獲取第一語音信號和第二語音信號。
可選地,在根據本發明的聲紋識別方法中,將待驗證的語音信號分離成多個語音信號分量包括:對待驗證的語音信號進行端點檢測,以獲取一個或多個非靜音語音信號;對各非靜音語音信號,提取非靜音語音信號的語音特征參數,并基于語音特征參數對非靜音語音信號進行分離,以獲取對應的多個語音信號分量。
可選地,在根據本發明的聲紋識別方法中,語音特征參數包括梅爾頻率倒譜系數。
可選地,在根據本發明的聲紋識別方法中,提取所述非靜音語音信號的語音特征參數包括:對非靜音語音信號進行分幀加窗處理,以生成對應的多個語音幀;計算各語音幀的離散功率譜,通過預設的三角帶通濾波器組對離散功率譜進行濾波,得到對應的系數集合;利用離散余弦變換對系數集合進行處理,以生成語音幀的梅爾頻率倒譜系數。
可選地,在根據本發明的聲紋識別方法中,基于語音特征參數對非靜音語音信號進行分離,以獲取對應的多個語音信號分量包括:對非靜音語音信號包括的多個語音幀,根據語音特征參數,計算相鄰語音幀之間的特征距離;基于預設的第一距離準則和特征距離,確定相鄰語音幀是否來源于同一聲源;將來源于同一聲源的相鄰語音幀進行合并,以形成對應的語音信號分量。
可選地,在根據本發明的聲紋識別方法中,對多個語音信號分量進行聲源聚類,以獲取第一語音信號和第二語音信號包括:根據預設的第二距離準則,連續地合并多個語音信號分量中最相鄰的兩個語音信號分量,以聚類生成第一語音信號和第二語音信號。
可選地,在根據本發明的聲紋識別方法中,分別對第一語音信號和第二語音信號進行聲紋識別包括:將第一語音信號進行預處理,以獲取第一語音信號對應的多個第一語音幀;計算各第一語音幀的語音特征參數,基于語音特征參數確定第一語音信號的聲紋特征;根據第一語音信號的聲紋特征,對第一語音信號進行評分,以確定第一語音信號分值。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于阿里巴巴集團控股有限公司,未經阿里巴巴集團控股有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811382285.4/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:延遲安全電路
- 下一篇:一種光伏節能裝置的應用





