[發(fā)明專利]語音識別模型自訓練方法及系統(tǒng)有效

申請?zhí)枺?/td>	202011554087.9	申請日：	2020-12-24
公開（公告）號：	CN112530413B	公開（公告）日：	2022-11-04
發(fā)明（設計）人：	薛少飛	申請（專利權）人：	思必馳科技股份有限公司
主分類號：	G10L15/06	分類號：	G10L15/06
代理公司：	北京商專永信知識產(chǎn)權代理事務所(普通合伙) 11400	代理人：	黃謙;車江華
地址：	215123 江蘇省蘇州市蘇***	國省代碼：	江蘇;32
權利要求書：	查看更多	說明書：	查看更多
摘要：
搜索關鍵詞：	語音識別模型訓練方法系統(tǒng)
鉆瓜網(wǎng) 技術展會專利詞庫專利權人專利榜在售專利公布日期熱門專利

【權利要求書】：

1.一種語音識別模型自訓練的方法，包括：

利用合成音頻數(shù)據(jù)和當前上傳的用戶音頻數(shù)據(jù)，對語音識別模型進行自訓練，其中，所述合成音頻數(shù)據(jù)由已存儲的文本和參數(shù)化的聲學環(huán)境信息生成；

在自訓練后，不存儲所述用戶音頻數(shù)據(jù)，將所述用戶音頻數(shù)據(jù)轉(zhuǎn)化為文本和參數(shù)化的聲學環(huán)境信息進行存儲，其中，所述自訓練為增量自訓練。

2.根據(jù)權利要求1所述的方法，其中，所述已存儲的文本和參數(shù)化的聲學環(huán)境信息還包括通用的文本和通用的參數(shù)化的聲學環(huán)境信息。

3.根據(jù)權利要求1所述的方法，其中，所述合成音頻數(shù)據(jù)由已存儲的文本和參數(shù)化的聲學環(huán)境信息輸入至數(shù)據(jù)海綿模型生成的。

4.根據(jù)權利要求3所述的方法，其中，所述數(shù)據(jù)海綿模型的訓練過程包括：

提取訓練音頻中的聲學環(huán)境參數(shù)；

通過所述聲學環(huán)境參數(shù)、所述訓練音頻、所述訓練音頻對應的標注文本訓練，輸入為所述聲學環(huán)境參數(shù)、文本，輸出為合成音頻數(shù)據(jù)的數(shù)據(jù)海綿模型。

5.根據(jù)權利要求1所述的方法，其中，所述參數(shù)化的聲學環(huán)境信息包括：i-vector矢量，用于表示說話人、噪聲環(huán)境、語速的信息。

6.一種語音識別模型自訓練的系統(tǒng)，包括：

自訓練程序模塊，用于利用合成音頻數(shù)據(jù)和當前上傳的用戶音頻數(shù)據(jù)，對語音識別模型進行自訓練，其中，所述合成音頻數(shù)據(jù)由已存儲的文本和參數(shù)化的聲學環(huán)境信息生成，

7.一種電子設備，其包括：至少一個處理器，以及與所述至少一個處理器通信連接的存儲器，其中，所述存儲器存儲有可被所述至少一個處理器執(zhí)行的指令，所述指令被所述至少一個處理器執(zhí)行，以使所述至少一個處理器能夠執(zhí)行權利要求1-5中任一項所述方法的步驟。

8.一種存儲介質(zhì)，其上存儲有計算機程序，其特征在于，該程序被處理器執(zhí)行時實現(xiàn)權利要求1-5中任一項所述方法的步驟。

下載完整專利技術內(nèi)容需要扣除積分，VIP會員可以免費下載。

免登錄下載普通用戶下載升級VIP會員，免費下載

該專利技術資料僅供研究查看技術是否侵權等信息，商用須獲得專利權人授權。該專利全部權利屬于思必馳科技股份有限公司，未經(jīng)思必馳科技股份有限公司許可，擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作，請聯(lián)系【客服】

本文鏈接：http://www.szxzyx.cn/pat/books/202011554087.9/1.html，轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。

專利分類

專利文獻下載

說明：

1、專利原文基于中國國家知識產(chǎn)權局專利說明書；

2、支持發(fā)明專利、實用新型專利、外觀設計專利（升級中）；

3、專利數(shù)據(jù)每周兩次同步更新，支持Adobe PDF格式；

4、內(nèi)容包括專利技術的結構示意圖、流程工藝圖或技術構造圖；

5、已全新升級為極速版,下載速度顯著提升！歡迎使用！

請您登陸后，進行下載，點擊【登陸】【注冊】