[發明專利]語音數據識別方法、裝置、設備及介質在審
| 申請號: | 202010417958.6 | 申請日: | 2020-05-15 |
| 公開(公告)號: | CN111554277A | 公開(公告)日: | 2020-08-18 |
| 發明(設計)人: | 宋元峰 | 申請(專利權)人: | 深圳前海微眾銀行股份有限公司 |
| 主分類號: | G10L15/06 | 分類號: | G10L15/06;G10L15/08;G10L15/22;G10L21/0272 |
| 代理公司: | 深圳市世紀恒程知識產權代理事務所 44287 | 代理人: | 張婷 |
| 地址: | 518000 廣東省深圳市前海深港合作區前*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 語音 數據 識別 方法 裝置 設備 介質 | ||
1.一種語音數據識別方法,其特征在于,所述語音數據識別方法包括:
獲取待識別語音數據,將所述待識別語音數據輸入至基于非人工標注語音數據優化的預設識別模型中;
其中,所述非人工標注語音數據是基于模擬標簽數據優化的預設預訓練模型得到的,所述模擬標簽數據是基于預設無標簽原始語音數據轉換得到的;
基于所述預設識別模型,對所述待識別語音數據進行特征提取處理,得到分類結果。
2.如權利要求1所述語音數據識別方法,其特征在于,所述模擬標簽數據為通過將預設無標簽原始語音數據,部分替換為生成的無標簽語音數據后,得到的,且所述模擬標簽數據至少包括真假模擬標簽的數據。
3.如權利要求2所述語音數據識別方法,其特征在于,所述基于所述預設識別模型,對所述待識別語音數據進行特征提取處理,得到分類結果的步驟之前,所述方法還包括:
獲取預設無標簽的原始語音數據;
生成無標簽語音數據,將所述預設無標簽原始語音數據,部分替換為所述無標簽語音數據,得到模擬標簽數據;
基于所述模擬標簽數據,對預設訓練模型進行訓練,得到滿足預設條件的目標模型,將所述目標模型設置為所述預設預訓練模型。
4.如權利要求2所述語音數據識別方法,其特征在于,所述基于所述模擬標簽數據,對預設訓練模型進行訓練,得到滿足預設條件的目標模型,將所述目標模型設置為所述預設預訓練模型的步驟,包括:
確定所述模擬標簽數據中的模擬假標簽數據以及模擬真標簽數據;
將所述模擬假標簽數據以及模擬真標簽數據輸入至預設訓練模型中,得到識別結果;
基于所述識別結果以及所述模擬標簽數據中的真假模擬標簽調整所述預設訓練模型的模型參數,直至得到滿足預設條件的目標模型,將所述目標模型設置為所述預設預訓練模型。
5.如權利要求2所述語音數據識別方法,其特征在于,所述獲取預設無標簽的原始語音數據的步驟,包括:
獲取無標簽的原始語音文件,對所述原始語音文件進行基于預設注意力機制的向量編碼處理,得到預設無標簽的原始語音數據。
6.如權利要求5所述語音數據識別方法,其特征在于,所述生成無標簽語音數據,將所述預設無標簽原始語音數據,部分替換為所述無標簽語音數據,得到模擬標簽數據的步驟,包括:
生成無標簽語音數據,其中,所述無標簽語音數據包括無標簽隨機語音幀數據或者無標簽隨機語音片段數據;
將所述預設無標簽原始語音數據,部分替換為所述無標簽語音數據,得到模擬標簽數據。
7.如權利要求1-6任一項所述語音數據識別方法,其特征在于,所述基于所述預設識別模型,對所述待識別語音數據進行特征提取處理,得到分類結果的步驟之后,所述方法包括:
將所述待識別語音數據以及所述分類結果對所述預設識別模型進行更新,得到更新的預設識別模型。
8.一種語音數據識別裝置,其特征在于,所述語音數據識別裝置包括:
第一獲取模塊,用于獲取待識別語音數據,將所述待識別語音數據輸入至基于非人工標注語音數據優化的預設識別模型中;
其中,所述非人工標注語音數據是基于模擬標簽數據優化的預設預訓練模型得到的,所述模擬標簽數據是基于預設無標簽原始語音數據轉換得到的;
分類模塊,用于基于所述預設識別模型,對所述待識別語音數據進行特征提取處理,得到分類結果。
9.一種語音數據識別設備,其特征在于,所述語音數據識別設備包括:存儲器、處理器以及存儲在存儲器上的用于實現所述語音數據識別方法的程序,
所述存儲器用于存儲實現語音數據識別方法的程序;
所述處理器用于執行實現所述語音數據識別方法的程序,以實現如權利要求1至7中任一項所述語音數據識別方法的步驟。
10.一種介質,其特征在于,所述介質上存儲有實現語音數據識別方法的程序,所述實現語音數據識別方法的程序被處理器執行以實現如權利要求1至7中任一項所述語音數據識別方法的步驟。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于深圳前海微眾銀行股份有限公司,未經深圳前海微眾銀行股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010417958.6/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種新型球閥
- 下一篇:脂肪酸在制備鋰離子電池中的應用及制取電極材料的方法
- 數據顯示系統、數據中繼設備、數據中繼方法、數據系統、接收設備和數據讀取方法
- 數據記錄方法、數據記錄裝置、數據記錄媒體、數據重播方法和數據重播裝置
- 數據發送方法、數據發送系統、數據發送裝置以及數據結構
- 數據顯示系統、數據中繼設備、數據中繼方法及數據系統
- 數據嵌入裝置、數據嵌入方法、數據提取裝置及數據提取方法
- 數據管理裝置、數據編輯裝置、數據閱覽裝置、數據管理方法、數據編輯方法以及數據閱覽方法
- 數據發送和數據接收設備、數據發送和數據接收方法
- 數據發送裝置、數據接收裝置、數據收發系統、數據發送方法、數據接收方法和數據收發方法
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置





