[發(fā)明專(zhuān)利]韻律預(yù)測(cè)模型的優(yōu)化方法及系統(tǒng)有效
| 申請(qǐng)?zhí)枺?/td> | 201911421271.3 | 申請(qǐng)日: | 2019-12-31 |
| 公開(kāi)(公告)號(hào): | CN111128122B | 公開(kāi)(公告)日: | 2022-08-16 |
| 發(fā)明(設(shè)計(jì))人: | 張晴;張輝 | 申請(qǐng)(專(zhuān)利權(quán))人: | 思必馳科技股份有限公司 |
| 主分類(lèi)號(hào): | G10L13/10 | 分類(lèi)號(hào): | G10L13/10;G10L13/08 |
| 代理公司: | 北京商專(zhuān)永信知識(shí)產(chǎn)權(quán)代理事務(wù)所(普通合伙) 11400 | 代理人: | 黃謙;車(chē)江華 |
| 地址: | 215123 江蘇省蘇州市蘇*** | 國(guó)省代碼: | 江蘇;32 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 韻律 預(yù)測(cè) 模型 優(yōu)化 方法 系統(tǒng) | ||
1.一種韻律預(yù)測(cè)模型的優(yōu)化方法,包括:
對(duì)韻律預(yù)測(cè)模型預(yù)測(cè)錯(cuò)誤的語(yǔ)句進(jìn)行分詞,其中,所述語(yǔ)句中韻律錯(cuò)誤的詞語(yǔ)帶有韻律標(biāo)記;
將不帶有所述韻律標(biāo)記的詞語(yǔ)確定為可替換詞語(yǔ),將帶有所述韻律標(biāo)記的詞語(yǔ)確定為不可替換詞語(yǔ),對(duì)所述語(yǔ)句中可替換詞語(yǔ)進(jìn)行同義詞增強(qiáng),生成所述語(yǔ)句的第一訓(xùn)練數(shù)據(jù)集;
通過(guò)文本相似度從語(yǔ)料池中獲取與所述語(yǔ)句相似的其他語(yǔ)句,將所述其他語(yǔ)句向開(kāi)發(fā)者反饋,接收開(kāi)發(fā)者對(duì)所述其他語(yǔ)句內(nèi)的詞語(yǔ)韻律標(biāo)記后的第二訓(xùn)練數(shù)據(jù)集;
基于至少一部分的所述第一訓(xùn)練數(shù)據(jù)集以及至少一部分的所述第二訓(xùn)練數(shù)據(jù)集生成第三訓(xùn)練數(shù)據(jù)集,通過(guò)所述第三訓(xùn)練數(shù)據(jù)集對(duì)所述韻律預(yù)測(cè)模型進(jìn)行自適應(yīng)訓(xùn)練,以?xún)?yōu)化所述韻律預(yù)測(cè)模型。
2.根據(jù)權(quán)利要求1所述的方法,其中,所述基于至少一部分的所述第一訓(xùn)練數(shù)據(jù)集以及至少一部分的所述第二訓(xùn)練數(shù)據(jù)集生成第三訓(xùn)練數(shù)據(jù)集包括:
在所述第一訓(xùn)練數(shù)據(jù)集中提取一部分語(yǔ)句確定為第一訓(xùn)練集,提取另一部分語(yǔ)句確定為第一校驗(yàn)集;
在所述第二訓(xùn)練數(shù)據(jù)集中提取一部分語(yǔ)句確定為第二訓(xùn)練集,提取另一部分語(yǔ)句確定為第二校驗(yàn)集;
將所述第一訓(xùn)練集以及所述第二訓(xùn)練集進(jìn)行混合,得到第三訓(xùn)練數(shù)據(jù)集。
3.根據(jù)權(quán)利要求2所述的方法,其中,在所述通過(guò)所述第三訓(xùn)練數(shù)據(jù)集對(duì)所述韻律預(yù)測(cè)模型進(jìn)行自適應(yīng)訓(xùn)練之后,所述方法包括:
將所述第一校驗(yàn)集以及所述第二校驗(yàn)集進(jìn)行混合,得到第三校驗(yàn)數(shù)據(jù)集;
通過(guò)所述第三校驗(yàn)數(shù)據(jù)集對(duì)訓(xùn)練后的韻律預(yù)測(cè)模型進(jìn)行校驗(yàn)。
4.根據(jù)權(quán)利要求1所述的方法,其中,在所述對(duì)韻律預(yù)測(cè)模型預(yù)測(cè)錯(cuò)誤的語(yǔ)句進(jìn)行分詞之前,所述方法包括:
對(duì)所述預(yù)測(cè)錯(cuò)誤的語(yǔ)句進(jìn)行文本正則化。
5.一種韻律預(yù)測(cè)模型的優(yōu)化系統(tǒng),包括:
語(yǔ)句分詞程序模塊,用于對(duì)韻律預(yù)測(cè)模型預(yù)測(cè)錯(cuò)誤的語(yǔ)句進(jìn)行分詞,其中,所述語(yǔ)句中韻律錯(cuò)誤的詞語(yǔ)帶有韻律標(biāo)記;
同義詞增強(qiáng)程序模塊,用于將不帶有所述韻律標(biāo)記的詞語(yǔ)確定為可替換詞語(yǔ),將帶有所述韻律標(biāo)記的詞語(yǔ)確定為不可替換詞語(yǔ),對(duì)所述語(yǔ)句中可替換詞語(yǔ)進(jìn)行同義詞增強(qiáng),生成所述語(yǔ)句的第一訓(xùn)練數(shù)據(jù)集;
相似語(yǔ)句獲取程序模塊,用于通過(guò)文本相似度從語(yǔ)料池中獲取與所述語(yǔ)句相似的其他語(yǔ)句,將所述其他語(yǔ)句向開(kāi)發(fā)者反饋,接收開(kāi)發(fā)者對(duì)所述其他語(yǔ)句內(nèi)的詞語(yǔ)韻律標(biāo)記后的第二訓(xùn)練數(shù)據(jù)集;
模型優(yōu)化程序模塊,用于基于至少一部分的所述第一訓(xùn)練數(shù)據(jù)集以及至少一部分的所述第二訓(xùn)練數(shù)據(jù)集生成第三訓(xùn)練數(shù)據(jù)集,通過(guò)所述第三訓(xùn)練數(shù)據(jù)集對(duì)所述韻律預(yù)測(cè)模型進(jìn)行自適應(yīng)訓(xùn)練,以?xún)?yōu)化所述韻律預(yù)測(cè)模型。
6.根據(jù)權(quán)利要求5所述的系統(tǒng),其中,所述模型優(yōu)化程序模塊用于:
在所述第一訓(xùn)練數(shù)據(jù)集中提取一部分語(yǔ)句確定為第一訓(xùn)練集,提取另一部分語(yǔ)句確定為第一校驗(yàn)集;
在所述第二訓(xùn)練數(shù)據(jù)集中提取一部分語(yǔ)句確定為第二訓(xùn)練集,提取另一部分語(yǔ)句確定為第二校驗(yàn)集;
將所述第一訓(xùn)練集以及所述第二訓(xùn)練集進(jìn)行混合,得到第三訓(xùn)練數(shù)據(jù)集。
7.根據(jù)權(quán)利要求6所述的系統(tǒng),其中,所述模型優(yōu)化程序模塊還用于:
將所述第一校驗(yàn)集以及所述第二校驗(yàn)集進(jìn)行混合,得到第三校驗(yàn)數(shù)據(jù)集;
通過(guò)所述第三校驗(yàn)數(shù)據(jù)集對(duì)訓(xùn)練后的韻律預(yù)測(cè)模型進(jìn)行校驗(yàn)。
8.根據(jù)權(quán)利要求5所述的系統(tǒng),其中,所述語(yǔ)句分詞程序模塊還用于:
對(duì)所述預(yù)測(cè)錯(cuò)誤的語(yǔ)句進(jìn)行文本正則化。
9.一種電子設(shè)備,其包括:至少一個(gè)處理器,以及與所述至少一個(gè)處理器通信連接的存儲(chǔ)器,其中,所述存儲(chǔ)器存儲(chǔ)有可被所述至少一個(gè)處理器執(zhí)行的指令,所述指令被所述至少一個(gè)處理器執(zhí)行,以使所述至少一個(gè)處理器能夠執(zhí)行權(quán)利要求1-4中任一項(xiàng)所述方法的步驟。
10.一種存儲(chǔ)介質(zhì),其上存儲(chǔ)有計(jì)算機(jī)程序,其特征在于,該程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)權(quán)利要求1-4中任一項(xiàng)所述方法的步驟。
該專(zhuān)利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專(zhuān)利權(quán)人授權(quán)。該專(zhuān)利全部權(quán)利屬于思必馳科技股份有限公司,未經(jīng)思必馳科技股份有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買(mǎi)此專(zhuān)利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201911421271.3/1.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專(zhuān)利網(wǎng)。
- 同類(lèi)專(zhuān)利
- 專(zhuān)利分類(lèi)
G10L 語(yǔ)音分析或合成;語(yǔ)音識(shí)別;音頻分析或處理
G10L13-00 語(yǔ)音合成;文本-語(yǔ)音合成系統(tǒng)
G10L13-02 .產(chǎn)生合成語(yǔ)音的方法;語(yǔ)音合成設(shè)備
G10L13-06 .語(yǔ)音合成設(shè)備中使用的基本語(yǔ)音單位;級(jí)聯(lián)規(guī)則
G10L13-08 .文本分析或文本以外的語(yǔ)音合成參數(shù)的產(chǎn)生,例如語(yǔ)義圖翻譯為音素、韻律產(chǎn)生、重音或聲調(diào)測(cè)定
G10L13-04 ..語(yǔ)音合成系統(tǒng)的零部件,例如合成設(shè)備結(jié)構(gòu)或存儲(chǔ)器管理
- 語(yǔ)音合成方法及系統(tǒng)
- 韻律結(jié)構(gòu)分析裝置與語(yǔ)音合成的裝置及方法
- 聲音合成裝置、方法以及存儲(chǔ)介質(zhì)
- 韻律層級(jí)預(yù)測(cè)模型的生成及韻律層級(jí)預(yù)測(cè)方法和裝置
- 韻律標(biāo)注方法、裝置和設(shè)備
- 一種韻律預(yù)測(cè)效果的評(píng)估方法及裝置
- 基于韻律特征預(yù)測(cè)的語(yǔ)音合成方法、裝置、終端及介質(zhì)
- 韻律模型訓(xùn)練方法及裝置
- 韻律預(yù)測(cè)模型訓(xùn)練方法、韻律預(yù)測(cè)方法及相關(guān)裝置
- 在自動(dòng)化配音場(chǎng)景中實(shí)現(xiàn)短語(yǔ)音同步的方法和裝置
- 圖像編碼裝置、圖像編碼方法、圖像譯碼裝置、圖像譯碼方法、程序以及記錄介質(zhì)
- 圖像編碼裝置、圖像編碼方法、圖像譯碼裝置、圖像譯碼方法
- 圖像編碼裝置、圖像編碼方法、圖像譯碼裝置、圖像譯碼方法
- 基于時(shí)間序列預(yù)測(cè)模型適用性量化的預(yù)測(cè)模型選擇方法
- 圖像編碼裝置、圖像編碼方法、圖像譯碼裝置、圖像譯碼方法
- 分類(lèi)預(yù)測(cè)方法及裝置、預(yù)測(cè)模型訓(xùn)練方法及裝置
- 幀內(nèi)預(yù)測(cè)的方法及裝置
- 圖像預(yù)測(cè)方法及裝置、電子設(shè)備和存儲(chǔ)介質(zhì)
- 文本預(yù)測(cè)方法、裝置以及電子設(shè)備
- 模型融合方法、預(yù)測(cè)方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)





