[發明專利]基于聲紋識別的身份驗證的方法及系統在審
| 申請號: | 201710147695.X | 申請日: | 2017-03-13 |
| 公開(公告)號: | CN107068154A | 公開(公告)日: | 2017-08-18 |
| 發明(設計)人: | 王健宗;丁涵宇;郭卉;肖京 | 申請(專利權)人: | 平安科技(深圳)有限公司 |
| 主分類號: | G10L17/02 | 分類號: | G10L17/02;G10L17/04;G10L17/06;G10L25/24;G10L25/18 |
| 代理公司: | 深圳市沃德知識產權代理事務所(普通合伙)44347 | 代理人: | 高杰,于志光 |
| 地址: | 518000 廣東省深*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 聲紋 識別 身份驗證 方法 系統 | ||
技術領域
本發明涉及通信技術領域,尤其涉及一種基于聲紋識別的身份驗證的方法及系統。
背景技術
目前,大型金融公司的業務范圍涉及保險、銀行、投資等多個業務范疇,每個業務范疇通常都需要同客戶進行溝通,溝通的方式有多種(例如電話溝通或者面對面溝通等)。在進行溝通之前,對客戶的身份進行驗證成為保證業務安全的重要組成部分。為了滿足業務的實時性需求,金融公司通常采用人工方式對客戶的身份進行分析驗證。由于客戶群體龐大,依靠人工進行判別分析以對驗證客戶的身份的方式準確性也不高,效率也低。
發明內容
本發明的目的在于提供一種基于聲紋識別的身份驗證的方法及系統,旨在提高用戶身份驗證的準確率及效率。
為實現上述目的,本發明提供一種基于聲紋識別的身份驗證的方法,所述基于聲紋識別的身份驗證的方法包括:
S1,在接收到進行身份驗證的用戶的語音數據后,獲取所述語音數據的聲紋特征,并基于所述聲紋特征構建對應的聲紋特征向量;
S2,將所述聲紋特征向量輸入預先訓練生成的背景信道模型,以構建出所述語音數據對應的當前聲紋鑒別向量;
S3,計算所述當前聲紋鑒別向量與預存的該用戶的標準聲紋鑒別向量之間的空間距離,基于所述距離對該用戶進行身份驗證,并生成驗證結果。
優選地,所述步驟S1包括:
S11,對所述語音數據進行預加重、分幀和加窗處理;
S12,對每一個加窗進行傅立葉變換得到對應的頻譜;
S13,將所述頻譜輸入梅爾濾波器以輸出得到梅爾頻譜;
S14,在梅爾頻譜上面進行倒譜分析以獲得梅爾頻率倒譜系數MFCC,基于所述梅爾頻率倒譜系數MFCC組成對應的聲紋特征向量。
優選地,所述步驟S3包括:
S31,計算所述當前聲紋鑒別向量與預存的該用戶的標準聲紋鑒別向量之間的余弦距離:為所述標準聲紋鑒別向量,為當前聲紋鑒別向量;
S32,若所述余弦距離小于或者等于預設的距離閾值,則生成驗證通過的信息;
S33,若所述余弦距離大于預設的距離閾值,則生成驗證不通過的信息。
優選地,所述背景信道模型為高斯混合模型,所述步驟S1之前包括:
獲取預設數量的語音數據樣本,并獲取各語音數據樣本對應的聲紋特征,并基于各語音數據樣本對應的聲紋特征構建各語音數據樣本對應的聲紋特征向量;
將各語音數據樣本對應的聲紋特征向量分為第一比例的訓練集和第二比例的驗證集,所述第一比例及第二比例的和小于等于1;
利用所述訓練集中的聲紋特征向量對高斯混合模型進行訓練,并在訓練完成后,利用所述驗證集對訓練后的高斯混合模型的準確率進行驗證;
若所述準確率大于預設閾值,則模型訓練結束,以訓練后的高斯混合模型作為所述步驟S2的背景信道模型,或者,若所述準確率小于等于預設閾值,則增加所述語音數據樣本的數量,并基于增加后的語音數據樣本重新進行訓練。
優選地,所述步驟S3替換為:計算所述當前聲紋鑒別向量與預存的各標準聲紋鑒別向量之間的空間距離,獲取最小的空間距離,基于所述最小的空間距離對該用戶進行身份驗證,并生成驗證結果。
為實現上述目的,本發明還提供一種基于聲紋識別的身份驗證的系統,所述基于聲紋識別的身份驗證的系統包括:
第一獲取模塊,用于在接收到進行身份驗證的用戶的語音數據后,獲取所述語音數據的聲紋特征,并基于所述聲紋特征構建對應的聲紋特征向量;
構建模塊,用于將所述聲紋特征向量輸入預先訓練生成的背景信道模型,以構建出所述語音數據對應的當前聲紋鑒別向量;
第一驗證模塊,用于計算所述當前聲紋鑒別向量與預存的該用戶的標準聲紋鑒別向量之間的空間距離,基于所述距離對該用戶進行身份驗證,并生成驗證結果。
優選地,所述第一獲取模塊具體用于對所述語音數據進行預加重、分幀和加窗處理;對每一個加窗進行傅立葉變換得到對應的頻譜;將所述頻譜輸入梅爾濾波器以輸出得到梅爾頻譜;在梅爾頻譜上面進行倒譜分析以獲得梅爾頻率倒譜系數MFCC,基于所述梅爾頻率倒譜系數MFCC組成對應的聲紋特征向量。
優選地,所述第一驗證模塊具體用于計算所述當前聲紋鑒別向量與預存的該用戶的標準聲紋鑒別向量之間的余弦距離:為所述標準聲紋鑒別向量,為當前聲紋鑒別向量;若所述余弦距離小于或者等于預設的距離閾值,則生成驗證通過的信息;若所述余弦距離大于預設的距離閾值,則生成驗證不通過的信息。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于平安科技(深圳)有限公司,未經平安科技(深圳)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710147695.X/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:解鎖方法及裝置
- 下一篇:一種基于方差和時域峰值的多級音頻暫穩態判決方法





