[發(fā)明專利]樣本生成、模型訓(xùn)練、口型驅(qū)動(dòng)方法、裝置、設(shè)備及介質(zhì)在審
| 申請(qǐng)?zhí)枺?/td> | 202110642755.1 | 申請(qǐng)日: | 2021-06-09 |
| 公開(kāi)(公告)號(hào): | CN113314145A | 公開(kāi)(公告)日: | 2021-08-27 |
| 發(fā)明(設(shè)計(jì))人: | 陀得意;林哲;司季雨;韓欣彤;康世胤;劉峰;游于人;許佳 | 申請(qǐng)(專利權(quán))人: | 廣州虎牙信息科技有限公司 |
| 主分類號(hào): | G10L25/24 | 分類號(hào): | G10L25/24;G10L25/30;G10L25/87;G06F40/30;G06F40/289;G06N3/04;G06N3/08 |
| 代理公司: | 北京品源專利代理有限公司 11332 | 代理人: | 孟金喆 |
| 地址: | 511442 廣東省廣州市番禺*** | 國(guó)省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說(shuō)明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 樣本 生成 模型 訓(xùn)練 口型 驅(qū)動(dòng) 方法 裝置 設(shè)備 介質(zhì) | ||
1.一種訓(xùn)練樣本的生成方法,其特征在于,包括:
捕捉得到真實(shí)人物在講話過(guò)程中形成的語(yǔ)音片段和口型驅(qū)動(dòng)參數(shù)序列;
使用口型驅(qū)動(dòng)參數(shù)序列對(duì)虛擬人物進(jìn)行連續(xù)口型驅(qū)動(dòng),并根據(jù)驅(qū)動(dòng)結(jié)果,將所述口型驅(qū)動(dòng)參數(shù)序列與所述語(yǔ)音片段進(jìn)行時(shí)間對(duì)齊;
識(shí)別語(yǔ)音片段中的各有效語(yǔ)音段的起止時(shí)間,并根據(jù)起止時(shí)間,在口型驅(qū)動(dòng)參數(shù)序列中分別確定與各有效語(yǔ)音段分別對(duì)應(yīng)的口型驅(qū)動(dòng)參數(shù)子序列;
根據(jù)與有效語(yǔ)音段對(duì)應(yīng)的內(nèi)容表征向量,以及與有效語(yǔ)音段對(duì)應(yīng)的口型驅(qū)動(dòng)參數(shù)子序列,形成用于訓(xùn)練得到口型驅(qū)動(dòng)參數(shù)識(shí)別模型的訓(xùn)練樣本對(duì)。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述捕捉得到真實(shí)人物在講話過(guò)程中形成的語(yǔ)音片段和口型驅(qū)動(dòng)參數(shù)序列,包括:
通過(guò)語(yǔ)音采集設(shè)備捕捉得到真實(shí)人物在講話過(guò)程中形成的所述語(yǔ)音片段;
以及通過(guò)視頻采集設(shè)備捕捉得到真實(shí)人物在講話過(guò)程中形成的口型驅(qū)動(dòng)參數(shù)序列。
3.根據(jù)權(quán)利要求1所述的方法,其特征在于,在識(shí)別語(yǔ)音片段中的各有效語(yǔ)音段的起止時(shí)間之前,還包括:
對(duì)所述語(yǔ)音片段進(jìn)行語(yǔ)義理解,根據(jù)語(yǔ)義理解結(jié)果對(duì)所述語(yǔ)音片段進(jìn)行分段;
剔除不包含語(yǔ)義信息的各無(wú)效語(yǔ)音片段,得到各所述有效語(yǔ)音段。
4.根據(jù)權(quán)利要求3所述的方法,其特征在于,所述識(shí)別語(yǔ)音片段中的各有效語(yǔ)音段的起止時(shí)間,并根據(jù)起止時(shí)間,在口型驅(qū)動(dòng)參數(shù)序列中分別確定與各有效語(yǔ)音段分別對(duì)應(yīng)的口型驅(qū)動(dòng)參數(shù)子序列,包括:
根據(jù)目標(biāo)有效語(yǔ)音段的屬性信息確定所述目標(biāo)有效語(yǔ)音段的目標(biāo)起止時(shí)間;
在口型驅(qū)動(dòng)參數(shù)序列中確定與所述目標(biāo)起止時(shí)間對(duì)應(yīng)的目標(biāo)口型驅(qū)動(dòng)參數(shù)子序列。
5.根據(jù)權(quán)利要求1所述的方法,其特征在于,在口型驅(qū)動(dòng)參數(shù)序列中分別確定與各有效語(yǔ)音段分別對(duì)應(yīng)的口型驅(qū)動(dòng)參數(shù)子序列,還包括:
提取所述有效語(yǔ)音段的梅爾頻率倒譜系數(shù)MFCC,生成與所述有效語(yǔ)音段對(duì)應(yīng)的內(nèi)容表征向量;
根據(jù)所述內(nèi)容表征向量對(duì)所述口型驅(qū)動(dòng)參數(shù)序列進(jìn)行重采樣,并根據(jù)重采樣后的口型驅(qū)動(dòng)參數(shù)序列確定與有效語(yǔ)音段對(duì)應(yīng)的口型驅(qū)動(dòng)參數(shù)子序列。
6.根據(jù)權(quán)利要求5所述的方法,其特征在于,所述根據(jù)與有效語(yǔ)音段對(duì)應(yīng)的內(nèi)容表征向量,以及與有效語(yǔ)音段對(duì)應(yīng)的口型驅(qū)動(dòng)參數(shù)子序列,形成用于訓(xùn)練得到口型驅(qū)動(dòng)參數(shù)識(shí)別模型的訓(xùn)練樣本對(duì),包括:
將與所述有效語(yǔ)音段對(duì)應(yīng)的內(nèi)容表征向量,以及與所述有效語(yǔ)音段對(duì)應(yīng)的口型驅(qū)動(dòng)參數(shù)子序列進(jìn)行配對(duì),形成用于訓(xùn)練得到口型驅(qū)動(dòng)參數(shù)識(shí)別模型的訓(xùn)練樣本對(duì)。
7.一種口型驅(qū)動(dòng)參數(shù)識(shí)別模型訓(xùn)練方法,其特征在于,包括:
將預(yù)先生成的多個(gè)訓(xùn)練樣本對(duì)輸入至神經(jīng)網(wǎng)絡(luò)模型中進(jìn)行迭代訓(xùn)練;
生成口型驅(qū)動(dòng)參數(shù)識(shí)別模型;
其中,各所述訓(xùn)練樣本對(duì)由權(quán)利要求1-6中任一項(xiàng)所述的訓(xùn)練樣本的生成方法生成。
8.一種口型驅(qū)動(dòng)方法,其特征在于,包括:
獲取待播報(bào)的非靜音語(yǔ)音片段,并確定與所述非靜音語(yǔ)音片段對(duì)應(yīng)的內(nèi)容表征向量;
將所述內(nèi)容表征向量輸入至預(yù)先訓(xùn)練的口型驅(qū)動(dòng)參數(shù)識(shí)別模型中,得到與所述非靜音語(yǔ)音片段對(duì)應(yīng)的目標(biāo)口型序列;其中,所述口型驅(qū)動(dòng)參數(shù)識(shí)別模型由權(quán)利要求7所述的口型驅(qū)動(dòng)參數(shù)識(shí)別模型訓(xùn)練方法訓(xùn)練得到;
響應(yīng)于非靜音語(yǔ)音片段的播放指令,使用所述目標(biāo)口型序列對(duì)虛擬人物進(jìn)行連續(xù)口型驅(qū)動(dòng)。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于廣州虎牙信息科技有限公司,未經(jīng)廣州虎牙信息科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110642755.1/1.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 樣本引入裝置、樣本引入基片和樣本引入方法
- 樣本查找方法、裝置及系統(tǒng)
- 模型訓(xùn)練、樣本平衡方法及裝置以及個(gè)人信用評(píng)分系統(tǒng)
- 樣本輸送系統(tǒng)、樣本輸送方法以及樣本檢測(cè)系統(tǒng)
- 樣本分析裝置、樣本檢測(cè)設(shè)備及樣本檢測(cè)方法
- 樣本檢測(cè)方法、樣本檢測(cè)裝置及樣本檢測(cè)系統(tǒng)
- 樣本架、樣本混勻系統(tǒng)及樣本分析儀
- 樣本收集管及樣本收集系統(tǒng)
- 樣本數(shù)據(jù)集的擴(kuò)容方法及模型的訓(xùn)練方法
- 行人重識(shí)別的噪聲樣本識(shí)別方法、裝置、設(shè)備和存儲(chǔ)介質(zhì)
- 等級(jí)精細(xì)視力訓(xùn)練表
- 視覺(jué)盲點(diǎn)演示與旁中心注視訓(xùn)練儀
- 一種訓(xùn)練室
- 視覺(jué)盲點(diǎn)演示與旁中心注視訓(xùn)練儀
- 一種訓(xùn)練室
- 康復(fù)訓(xùn)練器及其定量訓(xùn)練方法和定量訓(xùn)練裝置
- 一種分布式訓(xùn)練中梯度同步方法及裝置
- 訓(xùn)練模型的訓(xùn)練時(shí)長(zhǎng)預(yù)測(cè)方法及裝置
- 一種模型訓(xùn)練方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 一種計(jì)算機(jī)輔助的自閉癥兒童情感社交康復(fù)訓(xùn)練系統(tǒng)





