[發明專利]語音數據識別方法、裝置、設備及介質在審
| 申請號: | 202010417958.6 | 申請日: | 2020-05-15 |
| 公開(公告)號: | CN111554277A | 公開(公告)日: | 2020-08-18 |
| 發明(設計)人: | 宋元峰 | 申請(專利權)人: | 深圳前海微眾銀行股份有限公司 |
| 主分類號: | G10L15/06 | 分類號: | G10L15/06;G10L15/08;G10L15/22;G10L21/0272 |
| 代理公司: | 深圳市世紀恒程知識產權代理事務所 44287 | 代理人: | 張婷 |
| 地址: | 518000 廣東省深圳市前海深港合作區前*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 語音 數據 識別 方法 裝置 設備 介質 | ||
本申請公開了一種語音數據識別方法、裝置、設備和介質,該方法包括:獲取待識別語音數據,將所述待識別語音數據輸入至基于非人工標注語音數據優化的預設識別模型中;其中,所述非人工標注語音數據是基于模擬標簽數據優化的預設預訓練模型得到的,所述模擬標簽數據是基于預設無標簽原始語音數據轉換得到的;基于所述預設識別模型,對所述待識別語音數據進行特征提取處理,得到分類結果。本申請解決現有技術中因大量訓練數據需要人為標記,造成說話人語音分離的分離效率低的技術問題。
技術領域
本申請涉及金融科技(Fintech)的人工智能技術領域,尤其涉及一種語音數據識別方法、設備及介質。
背景技術
隨著金融科技,尤其是互聯網科技金融的不斷發展,越來越多的技術(如分布式、區塊鏈Blockchain、人工智能等)應用在金融領域,但金融業也對技術提出了更高的要求,如對金融業對語音數據識別也有更高的要求。
隨著移動設備的發展,語音成了日常的溝通方式,其中,從一段語音流中先切分出不同說話人的語音段,然后判斷每段語音屬于哪個說話人的說話人語音分離技術越來越重要,然而,目前,為準確進行說話人語音分離,需要大量的帶標記的訓練數據進行訓練,也即,現有技術中,為準確進行說話人語音分離,需要人為對大量訓練數據進行標記,這造成資源的浪費,減少了說話人語音分離的分離效率。
發明內容
本申請的主要目的在于提供一種語音數據識別方法、裝置、設備和介質,旨在解決現有技術中因大量訓練數據需要人為標記,造成說話人語音分離的分離效率低的技術問題。
為實現上述目的,本申請提供一種語音數據識別方法,所述語音數據識別方法包括:
獲取待識別語音數據,將所述待識別語音數據輸入至基于非人工標注語音數據優化的預設識別模型中;
其中,所述非人工標注語音數據是基于模擬標簽數據優化的預設預訓練模型得到的,所述模擬標簽數據是基于預設無標簽原始語音數據轉換得到的;
基于所述預設識別模型,對所述待識別語音數據進行特征提取處理,得到分類結果。
可選地,所述模擬標簽數據為通過將預設無標簽原始語音數據,部分替換為生成的無標簽語音數據后,得到的,且所述模擬標簽數據至少包括真假模擬標簽的數據。
可選地,所述基于所述預設識別模型,對所述待識別語音數據進行特征提取處理,得到分類結果的步驟之前,所述方法還包括:
獲取預設無標簽的原始語音數據;
生成無標簽語音數據,將所述預設無標簽原始語音數據,部分替換為所述無標簽語音數據,得到模擬標簽數據;
基于所述模擬標簽數據,對預設訓練模型進行訓練,得到滿足預設條件的目標模型,將所述目標模型設置為所述預設預訓練模型。
可選地,所述基于所述模擬標簽數據,對預設訓練模型進行訓練,得到滿足預設條件的目標模型,將所述目標模型設置為所述預設預訓練模型的步驟,包括:
確定所述模擬標簽數據中的模擬假標簽數據以及模擬真標簽數據;
將所述模擬假標簽數據以及模擬真標簽數據輸入至預設訓練模型中,得到識別結果;
基于所述識別結果以及所述模擬標簽數據中的真假模擬標簽調整所述預設訓練模型的模型參數,直至得到滿足預設條件的目標模型,將所述目標模型設置為所述預設預訓練模型。
可選地,所述獲取預設無標簽的原始語音數據的步驟,包括:
獲取無標簽的原始語音文件,對所述原始語音文件進行基于預設注意力機制的向量編碼處理,得到預設無標簽的原始語音數據。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于深圳前海微眾銀行股份有限公司,未經深圳前海微眾銀行股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010417958.6/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種新型球閥
- 下一篇:脂肪酸在制備鋰離子電池中的應用及制取電極材料的方法
- 數據顯示系統、數據中繼設備、數據中繼方法、數據系統、接收設備和數據讀取方法
- 數據記錄方法、數據記錄裝置、數據記錄媒體、數據重播方法和數據重播裝置
- 數據發送方法、數據發送系統、數據發送裝置以及數據結構
- 數據顯示系統、數據中繼設備、數據中繼方法及數據系統
- 數據嵌入裝置、數據嵌入方法、數據提取裝置及數據提取方法
- 數據管理裝置、數據編輯裝置、數據閱覽裝置、數據管理方法、數據編輯方法以及數據閱覽方法
- 數據發送和數據接收設備、數據發送和數據接收方法
- 數據發送裝置、數據接收裝置、數據收發系統、數據發送方法、數據接收方法和數據收發方法
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置





