[發明專利]模型訓練方法、模仿音檢測方法、裝置、設備及存儲介質在審
| 申請號: | 202010624032.4 | 申請日: | 2020-06-30 |
| 公開(公告)號: | CN111785303A | 公開(公告)日: | 2020-10-16 |
| 發明(設計)人: | 蔣俊;方磊;宣璇 | 申請(專利權)人: | 合肥訊飛數碼科技有限公司 |
| 主分類號: | G10L25/78 | 分類號: | G10L25/78;G10L25/51;G10L25/03 |
| 代理公司: | 北京集佳知識產權代理有限公司 11227 | 代理人: | 薛嬌 |
| 地址: | 230088 安徽省合肥市高新區*** | 國省代碼: | 安徽;34 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 模型 訓練 方法 模仿 檢測 裝置 設備 存儲 介質 | ||
1.一種模仿音檢測模型訓練方法,其特征在于,包括:
對樣本語音的各個語音幀分別進行特征提取,得到所述樣本語音的初始特征序列;
對所述初始特征序列中的部分初始特征進行修改,得到修改后的特征序列;
利用所述修改后的特征序列,確定所述樣本語音的各個語音幀的模仿音檢測結果;
以所述樣本語音的各個語音幀的模仿音檢測結果趨近于所述樣本語音的標簽為目標,對所述模仿音檢測模型的參數進行更新;所述標簽表征所述樣本語音中的各個語音幀是否為模仿音。
2.根據權利要求1所述的方法,其特征在于,所述對樣本語音的各個語音幀分別進行特征提取,得到所述樣本語音的初始特征序列,包括:
獲取樣本語音的各個語音幀的聲學特征;
對各個語音幀的聲學特征分別進行編碼,得到各個語音幀的初始編碼特征,作為所述樣本語音的初始特征序列。
3.根據權利要求2所述的方法,其特征在于,所述對所述初始特征序列中的部分初始特征進行修改,包括:
將所述樣本語音的預置比例的語音幀的初始編碼特征作為所述部分初始特征進行修改。
4.根據權利要求3所述的方法,其特征在于,所述將所述樣本語音的預置比例的語音幀的初始編碼特征作為所述部分初始特征進行修改,包括:
對所述預置比例的語音幀的初始編碼特征在時域的預置位置進行修改和/或在頻域的預置位置進行修改。
5.根據權利要求3所述的方法,其特征在于,所述利用所述修改后的特征序列,確定所述樣本語音的各個語音幀的模仿音檢測結果,包括:
對所述修后的特征序列中的每一個特征分別進行編碼,得到各個語音幀的目標編碼特征,作為所述樣本語音的目標特征序列;
利用所述目標特征序列,確定所述樣本語音的各個語音幀的模仿音檢測結果。
6.根據權利要求2所述的方法,其特征在于,所述對所述樣本語音的各個語音幀的聲學特征分別進行編碼,得到各個語音幀的初始編碼特征,包括:
對于每一個語音幀,獲取該語音幀的聲學特征的隱層特征,作為該語音幀的初始編碼特征;或者,
對于每一個語音幀,獲取該語音幀的聲學特征的隱層特征;對該語音幀的聲學特征進行二階差分,得到該語音幀的第一動態特征;對該語音幀的隱層特征進行二階差分,得到該語音幀的第二動態特征;將該語音幀的隱層特征、所述第一動態特征和所述第二動態特征融合,得到該語音幀的初始編碼特征。
7.根據權利要求2所述的方法,其特征在于,所述對各個語音幀的聲學特征分別進行編碼,得到各個語音幀的初始編碼特征,包括:
對于每一語音幀,通過所述模仿音檢測模型的第一編碼模塊獲取該語音幀的聲學特征的初始編碼特征;
所述第一編碼模塊是基于預先訓練好的語音分類模型中的第二編碼模塊獲得的;所述語音分類模型是以由樣本模仿音和樣本自然人語音構成的樣本語音對及其對應的標簽對為訓練數據訓練好的;所述標簽對用于標識所述樣本語音對中的模仿音和自然人語音。
8.根據權利要求7所述的方法,其特征在于,所述對所述模仿音檢測模型的參數進行更新包括對所述第一編碼模塊的參數的更新;或者,所述對所述模仿音檢測模型的參數進行更新不包括對所述第一編碼模塊的參數的更新。
9.根據權利要求7所述的方法,其特征在于,所述語音分類模型通過如下方式訓練得到:
通過所述第二編碼模塊對樣本語音對中的樣本模仿音的各個模仿語音幀的聲學特征和樣本自然人語音的各個自然人語音幀的聲學特征分別進行編碼,得到各個模仿語音幀的編碼特征和各個自然人語音幀的編碼特征;
通過所述語音分類模型的特征處理模塊將各個模仿語音幀的編碼特征和各個自然人語音幀的編碼特征融合,得到所述樣本語音對的融合特征;利用所述融合特征,確定所述樣本語音對中各語音的語音分類結果;
以所述樣本語音對中各語音的語音分類結果趨近于所述樣本語音對對應的標簽對為目標,對所述第二編碼模塊和所述特征處理模塊的參數進行更新。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于合肥訊飛數碼科技有限公司,未經合肥訊飛數碼科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010624032.4/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:垃圾滲濾液處理系統及工藝
- 下一篇:5G低剖面高性能超寬帶天線振子及基站天線





