[發(fā)明專利]模型訓練方法及組件,音素發(fā)音時長標注方法及組件在審
| 申請?zhí)枺?/td> | 202111179340.1 | 申請日: | 2021-10-09 |
| 公開(公告)號: | CN113936627A | 公開(公告)日: | 2022-01-14 |
| 發(fā)明(設計)人: | 莊曉濱 | 申請(專利權)人: | 騰訊音樂娛樂科技(深圳)有限公司 |
| 主分類號: | G10H1/00 | 分類號: | G10H1/00 |
| 代理公司: | 深圳市深佳知識產權代理事務所(普通合伙) 44285 | 代理人: | 林志鵬 |
| 地址: | 518052 廣東省深圳市前海深港合作區(qū)前*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 模型 訓練 方法 組件 音素 發(fā)音 標注 | ||
1.一種模型訓練方法,其特征在于,包括:
從歌曲音節(jié)集中獲取目標音節(jié)和所述目標音節(jié)的標簽;所述標簽包括:所述目標音節(jié)中的輔音音素的輔音發(fā)音幀數N0、所述目標音節(jié)中的元音音素的元音發(fā)音幀數N1;
按照所述輔音發(fā)音幀數N0和所述元音發(fā)音幀數N1,構建包括N0個輔音標記和N1個元音標記的目標序列;
將所述目標音節(jié)重復N次得到音節(jié)組;其中,N=N0+N1;;
將所述音節(jié)組輸入神經網絡模型,以使所述神經網絡模型輸出預測序列;所述預測序列包括N3個輔音標記和N4個元音標記;其中,N3+N4=N;
計算所述預測序列與所述目標序列之間的損失值;
基于所述損失值對所述神經網絡模型的參數進行調整,得到更新后的模型;
若更新后的模型收斂,則將更新后的模型作為音素發(fā)音時長識別模型。
2.根據權利要求1所述的方法,其特征在于,還包括:
若更新后的模型未收斂,則從所述歌曲音節(jié)集中重新獲取另一音節(jié)及該音節(jié)的標簽,以對更新后的模型進行迭代訓練,直至模型收斂時,將更新后的模型作為所述音素發(fā)音時長識別模型。
3.根據權利要求1所述的方法,其特征在于,所述將所述音節(jié)組輸入神經網絡模型,以使所述神經網絡模型輸出預測序列,包括:
所述神經網絡模型基于所述音節(jié)組中的所述目標音節(jié)的重復次數確定所述目標音節(jié)的發(fā)音總幀數N,并預測所述目標音節(jié)中的每幀發(fā)音的音素類型;
若任一幀發(fā)音的音素類型為輔音,則記錄一個輔音標記,若任一幀發(fā)音的音素類型為元音,則記錄一個元音標記,得到所述預測序列。
4.根據權利要求3所述的方法,其特征在于,所述預測所述目標音節(jié)中的每幀發(fā)音的音素類型,包括:
通過查詢音素詞典預測所述目標音節(jié)中的每幀發(fā)音的音素類型。
5.根據權利要求1至4任一項所述的方法,其特征在于,若所述目標音節(jié)為單音素元音音節(jié),則所述按照所述輔音發(fā)音幀數N0和所述元音發(fā)音幀數N1,構建包括N0個輔音標記和N1個元音標記的目標序列之后,還包括:
在所述目標序列的首位填充一個輔音標記;
相應地,在所述計算所述預測序列與所述目標序列之間的損失值之前,還包括:
在所述預測序列的首位填充一個輔音標記。
6.根據權利要求1至4任一項所述的方法,其特征在于,所述計算所述預測序列與所述目標序列之間的損失值之前,還包括:
檢測并消除所述預測序列中的噪點。
7.根據權利要求1至4任一項所述的方法,其特征在于,所述計算所述預測序列與所述目標序列之間的損失值,包括:
將所述預測序列與所述目標序列對位比較,得到N個比較結果;
基于所述N個對比結果確定所述損失值。
8.一種音素發(fā)音時長標注方法,其特征在于,包括:
獲取待標注文本;
將所述待標注文本轉換為音節(jié);
將所述音節(jié)輸入權利要求1至7任一項所述的音素發(fā)音時長識別模型,以使所述音素發(fā)音時長識別模型輸出標注序列;
基于所述標注序列確定所述音節(jié)中的元音音素的元音發(fā)音幀數和輔音音素的輔音發(fā)音幀數;
將所述元音發(fā)音幀數與單位幀長度的乘積記錄為元音發(fā)音時長,將所述輔音發(fā)音幀數與所述單位幀長度的乘積記錄為輔音發(fā)音時長;
將所述元音發(fā)音時長和所述輔音發(fā)音時長標注于所述音節(jié)。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于騰訊音樂娛樂科技(深圳)有限公司,未經騰訊音樂娛樂科技(深圳)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202111179340.1/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種自行車軸心加工方法
- 下一篇:抗體-藥物偶聯(lián)物





