[發明專利]更新聲紋數據的語音識別方法、終端裝置及存儲介質有效
| 申請號: | 201810030623.1 | 申請日: | 2018-01-12 |
| 公開(公告)號: | CN108269575B | 公開(公告)日: | 2021-11-02 |
| 發明(設計)人: | 王健宗;鄭斯奇;于夕畔;肖京 | 申請(專利權)人: | 平安科技(深圳)有限公司 |
| 主分類號: | G10L17/12 | 分類號: | G10L17/12;G10L17/02 |
| 代理公司: | 深圳市沃德知識產權代理事務所(普通合伙) 44347 | 代理人: | 高杰;于志光 |
| 地址: | 518000 廣東省深*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 更新 聲紋 數據 語音 識別 方法 終端 裝置 存儲 介質 | ||
本發明公開了一種更新聲紋數據的語音識別方法,包括:注冊預設數目的注冊語音,并計算每條注冊語音的特征語音向量;將所述每條注冊語音的特征語音向量進行兩兩比對打分;獲取驗證語音,并計算所述驗證語音的特征語音向量;將所述驗證語音的特征語音向量分別和注冊語音的特征語音向量進行兩兩比對打分,并根據所述驗證語音更新所述預設數目的注冊語音。本發明還提供一種終端裝置及存儲介質。本發明提供的更新聲紋數據的語音識別方法、終端裝置及存儲介質,可以在用戶每次驗證時,都將按照對比和更新的流程進行,可以提升后續聲紋驗證準確率,且能適應注冊人隨時間波動的聲音變化。
技術領域
本發明涉及語音識別領域,尤其涉及一種更新聲紋數據的語音識別方法、終端裝置及存儲介質。
背景技術
目前傳統的聲紋注冊識別方法中,一般包括如下幾個步驟:1.特征提取,在獲得用戶注冊語音數據后,對數據進行聲音特征的提取。2.生成鑒別向量。3.比對驗證,聲紋庫中保留用戶注冊時的特征向量(i-vector),每次驗證時,驗證語音提取的i-vector與注冊時i-vector進行比較,即利用預先確定的余弦距離公式計算當前鑒別向量與用戶對應的注冊向量之間的距離,若距離在設定的閾值范圍內,則認為兩個i-vector為同一人的語音所產生,即驗證成功;否則返回失敗。
然而,在這種傳統的注冊驗證下,每次比對時,對比的鑒別向量皆為用戶第一次注冊語音時生成的鑒別向量。隨時間變化,用戶聲音可能因年齡、身體狀況、環境等因素發生改變,每次驗證時使用注冊時的i-vector進行比較,可能導致驗證失敗。
發明內容
有鑒于此,本發明提出一種更新聲紋數據的語音識別方法、終端裝置及存儲介質,通過實施上述方式,可以提升后續聲紋驗證準確率,且能適應注冊人隨時間波動的聲音變化。
首先,為實現上述目的,本發明提出一種終端裝置,所述終端裝置包括存儲器、處理器,所述存儲器上存儲有可在所述處理器上運行的更新聲紋數據的語音識別程序,所述更新聲紋數據的語音識別程序被所述處理器執行時實現如下步驟:
注冊預設數目的用戶注冊語音,并計算所述預設數目的用戶注冊語音中的每條用戶注冊語音的特征語音向量;
將所述每條用戶注冊語音的特征語音向量進行兩兩比對打分,并獲取第一打分平均值作為第一閾值;
獲取驗證語音,并計算所述驗證語音的特征語音向量;
將所述驗證語音的特征語音向量分別和注冊語音的特征語音向量進行兩兩比對打分,并獲取第二打分平均值;
判斷所述第二打分平均值是否大于第二閾值,所述第二閾值為所述第一閾值加一預設值;及
若所述第二打分平均值大于所述第二閾值,則根據所述驗證語音更新注冊語音。
可選地,所述計算所述預設數目的用戶注冊語音中的每條用戶注冊語音的特征語音向量的步驟,包括:
使用MFCC方法提取每一份語音中每幀語音的MFCC特征并組成一個矩陣;及
使用UBM和特征語音向量提取器篩選出所述矩陣中最核心的特征,組成所述特征語音向量。
可選地,所述根據所述驗證語音更新所述注冊語音的步驟,還包括:
判斷所述第二打分平均值是否大于第三閾值,所述第三閾值大于所述第二閾值;及
將所述第二打分平均值大于所述第三閾值的所述驗證語音更新到所述注冊語音中,并根據更新后的所述注冊語音進行注冊。
可選地,所述第三閾值通過如下步驟確定:
選取所有所述第二打分平均值高于所述第二閾值的驗證語音,并計數為N;
將選取后的驗證語音對應的所述第二打分平均值進行由高到低排序;及
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于平安科技(深圳)有限公司,未經平安科技(深圳)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810030623.1/2.html,轉載請聲明來源鉆瓜專利網。
- 數據顯示系統、數據中繼設備、數據中繼方法、數據系統、接收設備和數據讀取方法
- 數據記錄方法、數據記錄裝置、數據記錄媒體、數據重播方法和數據重播裝置
- 數據發送方法、數據發送系統、數據發送裝置以及數據結構
- 數據顯示系統、數據中繼設備、數據中繼方法及數據系統
- 數據嵌入裝置、數據嵌入方法、數據提取裝置及數據提取方法
- 數據管理裝置、數據編輯裝置、數據閱覽裝置、數據管理方法、數據編輯方法以及數據閱覽方法
- 數據發送和數據接收設備、數據發送和數據接收方法
- 數據發送裝置、數據接收裝置、數據收發系統、數據發送方法、數據接收方法和數據收發方法
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置





