[發(fā)明專利]音頻分離網(wǎng)絡(luò)的訓(xùn)練方法、音頻分離方法、裝置及介質(zhì)有效
| 申請(qǐng)?zhí)枺?/td> | 202010086752.X | 申請(qǐng)日: | 2020-02-11 |
| 公開(kāi)(公告)號(hào): | CN111341341B | 公開(kāi)(公告)日: | 2021-08-17 |
| 發(fā)明(設(shè)計(jì))人: | 王珺;林永業(yè);蘇丹;俞棟 | 申請(qǐng)(專利權(quán))人: | 騰訊科技(深圳)有限公司 |
| 主分類號(hào): | G10L21/0272 | 分類號(hào): | G10L21/0272;G10L25/30;G06N3/04;G06N3/08 |
| 代理公司: | 北京派特恩知識(shí)產(chǎn)權(quán)代理有限公司 11270 | 代理人: | 崔曉嵐;張穎玲 |
| 地址: | 518000 廣東省深圳*** | 國(guó)省代碼: | 廣東;44 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 音頻 分離 網(wǎng)絡(luò) 訓(xùn)練 方法 裝置 介質(zhì) | ||
1.一種音頻分離網(wǎng)絡(luò)的訓(xùn)練方法,其特征在于,所述方法包括:
獲取第一分離樣本集合,所述第一分離樣本集合中至少包括兩類具有偽標(biāo)簽的音頻;
其中,所述獲取第一分離樣本集合,包括:獲取至少包括未標(biāo)注音頻的樣本音頻;采用已訓(xùn)練的有監(jiān)督網(wǎng)絡(luò),按照音頻數(shù)據(jù)的類型,對(duì)所述樣本音頻進(jìn)行分離,得到每一類型的分離樣本,以得到所述第一分離樣本集合;其中,所述有監(jiān)督網(wǎng)絡(luò)的網(wǎng)絡(luò)參數(shù)是基于無(wú)監(jiān)督網(wǎng)絡(luò)的網(wǎng)絡(luò)參數(shù)進(jìn)行更新的;
將每一第一分離樣本一一對(duì)應(yīng)的與不同的擾動(dòng)數(shù)據(jù)相乘,得到調(diào)整數(shù)據(jù)集合;
對(duì)所述調(diào)整數(shù)據(jù)集合中的調(diào)整數(shù)據(jù)求和,得到第一樣本集合;
采用無(wú)監(jiān)督網(wǎng)絡(luò)對(duì)所述第一樣本集合進(jìn)行分離,得到第二分離樣本集合;
確定每一第二分離樣本與所述第一分離樣本集合的真值數(shù)據(jù)之間的損失,得到每一第二分離樣本的損失,以得到損失集合;
采用所述第二分離樣本的損失,對(duì)所述無(wú)監(jiān)督網(wǎng)絡(luò)的網(wǎng)絡(luò)參數(shù)進(jìn)行調(diào)整,以使調(diào)整后的無(wú)監(jiān)督網(wǎng)絡(luò)輸出的分離結(jié)果的損失滿足收斂條件;
其中,所述采用所述第二分離樣本的損失,對(duì)所述無(wú)監(jiān)督網(wǎng)絡(luò)的網(wǎng)絡(luò)參數(shù)進(jìn)行調(diào)整,包括:從所述損失集合中,確定最小損失;基于所述最小損失,更新所述無(wú)監(jiān)督網(wǎng)絡(luò)的網(wǎng)絡(luò)參數(shù),得到更新的網(wǎng)絡(luò)參數(shù)。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,在所述基于所述最小損失,更新所述無(wú)監(jiān)督網(wǎng)絡(luò)的網(wǎng)絡(luò)參數(shù),得到更新的網(wǎng)絡(luò)參數(shù)之后,所述方法還包括:
將所述更新的網(wǎng)絡(luò)參數(shù)反饋給所述有監(jiān)督網(wǎng)絡(luò),以調(diào)整所述有監(jiān)督網(wǎng)絡(luò)的網(wǎng)絡(luò)參數(shù),得到更新的有監(jiān)督網(wǎng)絡(luò)。
3.根據(jù)權(quán)利要求2所述的方法,其特征在于,所述將所述更新的網(wǎng)絡(luò)參數(shù)反饋給所述有監(jiān)督網(wǎng)絡(luò),以調(diào)整所述有監(jiān)督網(wǎng)絡(luò)的網(wǎng)絡(luò)參數(shù),得到更新的有監(jiān)督網(wǎng)絡(luò),包括:
確定所述更新的網(wǎng)絡(luò)參數(shù)的滑動(dòng)平均值;
將所述滑動(dòng)平均值反饋給所述有監(jiān)督網(wǎng)絡(luò),以調(diào)整所述有監(jiān)督網(wǎng)絡(luò)的網(wǎng)絡(luò)參數(shù),以得到所述更新的有監(jiān)督網(wǎng)絡(luò)。
4.根據(jù)權(quán)利要求2或3所述的方法,其特征在于,在所述將所述更新的網(wǎng)絡(luò)參數(shù)反饋給所述有監(jiān)督網(wǎng)絡(luò),以調(diào)整所述有監(jiān)督網(wǎng)絡(luò)的網(wǎng)絡(luò)參數(shù),得到更新的有監(jiān)督網(wǎng)絡(luò)之后,所述方法還包括:
采用所述更新的有監(jiān)督網(wǎng)絡(luò),對(duì)所述樣本音頻進(jìn)行再次分離,得到第三分離樣本集合;
采用所述擾動(dòng)數(shù)據(jù)對(duì)所述第三分離樣本集合進(jìn)行插值,得到第二樣本集合,并將所述第二樣本集合輸入更新的無(wú)監(jiān)督網(wǎng)絡(luò);
采用所述更新的無(wú)監(jiān)督網(wǎng)絡(luò)對(duì)所述第二樣本集合進(jìn)行再次預(yù)測(cè)分離,得到第四分離樣本集合;
確定所述第四分離樣本集合中第四分離樣本的損失;
采用所述第四分離樣本的損失,對(duì)所述更新的無(wú)監(jiān)督網(wǎng)絡(luò)的網(wǎng)絡(luò)參數(shù)和所述更新的有監(jiān)督網(wǎng)絡(luò)的網(wǎng)絡(luò)參數(shù)進(jìn)行調(diào)整,以使調(diào)整后的更新的無(wú)監(jiān)督網(wǎng)絡(luò)輸出的分離結(jié)果的損失滿足收斂條件。
5.根據(jù)權(quán)利要求1所述的方法,其特征在于,在所述采用已訓(xùn)練的有監(jiān)督網(wǎng)絡(luò),按照音頻數(shù)據(jù)的類型,對(duì)所述樣本音頻進(jìn)行分離,得到每一類型的分離樣本,以得到所述第一分離樣本集合之前,所述方法還包括:
獲取有標(biāo)注的干凈樣本音頻和噪聲樣本音頻;
將所述干凈樣本音頻和噪聲樣本音頻相混合,得到第三樣本集合;
采用待訓(xùn)練的有監(jiān)督網(wǎng)絡(luò)對(duì)所述第三樣本集合進(jìn)行分離,得到第五分離樣本集合;
確定所述第五分離樣本集合中的第五分離樣本的損失;
采用所述第五分離樣本的損失,對(duì)所述待訓(xùn)練的有監(jiān)督網(wǎng)絡(luò)的網(wǎng)絡(luò)參數(shù)進(jìn)行調(diào)整,以使調(diào)整后的待訓(xùn)練的有監(jiān)督網(wǎng)絡(luò)輸出的分離結(jié)果的損失滿足收斂條件,得到已訓(xùn)練的所述有監(jiān)督網(wǎng)絡(luò)。
6.一種音頻分離方法,其特征在于,所述方法包括:
獲取待分離音頻;
采用已訓(xùn)練的神經(jīng)網(wǎng)絡(luò)對(duì)所述待分離音頻進(jìn)行分離,得到分離結(jié)果;其中,所述神經(jīng)網(wǎng)絡(luò)為基于上述權(quán)利要求1至5任一項(xiàng)所述的音頻分離網(wǎng)絡(luò)的訓(xùn)練方法訓(xùn)練得到的;
輸出所述分離結(jié)果。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于騰訊科技(深圳)有限公司,未經(jīng)騰訊科技(深圳)有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010086752.X/1.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 上一篇:數(shù)據(jù)處理方法、邊緣節(jié)點(diǎn)、數(shù)據(jù)中心及存儲(chǔ)介質(zhì)
- 下一篇:一種數(shù)據(jù)識(shí)別方法、裝置、設(shè)備以及可讀存儲(chǔ)介質(zhì)
- 同類專利
- 專利分類
G10L 語(yǔ)音分析或合成;語(yǔ)音識(shí)別;音頻分析或處理
G10L21-00 為了改變語(yǔ)音信號(hào)的質(zhì)量或其可識(shí)度而處理語(yǔ)音信號(hào),以產(chǎn)生另一種可聽(tīng)的或非可聽(tīng)的信號(hào),例如視覺(jué)信號(hào)或觸覺(jué)信號(hào)
G10L21-02 .語(yǔ)音增強(qiáng),例如降低噪聲或消除回聲
G10L21-04 .時(shí)間壓縮或擴(kuò)展
G10L21-06 .將語(yǔ)音轉(zhuǎn)換成非可聽(tīng)表達(dá)形式,例如語(yǔ)音可視化、觸覺(jué)輔助的語(yǔ)音處理
- 自動(dòng)配置藍(lán)牙A2DP傳輸音頻編碼格式的方法和系統(tǒng)
- 一種多路音頻處理方法、音頻播放終端及音頻接收裝置
- 一種音頻處理方法、裝置及終端設(shè)備
- 一種音頻質(zhì)量的檢測(cè)方法、裝置、電子設(shè)備及存儲(chǔ)介質(zhì)
- 音頻分離方法、裝置、設(shè)備及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)
- 一種音頻播放方法、裝置、以及計(jì)算機(jī)存儲(chǔ)介質(zhì)
- 一種音頻錄制系統(tǒng)
- 一種音頻共享系統(tǒng)及方法
- 音頻樣本生成方法、裝置、計(jì)算機(jī)設(shè)備及存儲(chǔ)介質(zhì)
- 音頻處理方法和裝置
- 網(wǎng)絡(luò)和網(wǎng)絡(luò)終端
- 網(wǎng)絡(luò)DNA
- 網(wǎng)絡(luò)地址自適應(yīng)系統(tǒng)和方法及應(yīng)用系統(tǒng)和方法
- 網(wǎng)絡(luò)系統(tǒng)及網(wǎng)絡(luò)至網(wǎng)絡(luò)橋接器
- 一種電力線網(wǎng)絡(luò)中根節(jié)點(diǎn)網(wǎng)絡(luò)協(xié)調(diào)方法和系統(tǒng)
- 一種多網(wǎng)絡(luò)定位方法、存儲(chǔ)介質(zhì)及移動(dòng)終端
- 網(wǎng)絡(luò)裝置、網(wǎng)絡(luò)系統(tǒng)、網(wǎng)絡(luò)方法以及網(wǎng)絡(luò)程序
- 從重復(fù)網(wǎng)絡(luò)地址自動(dòng)恢復(fù)的方法、網(wǎng)絡(luò)設(shè)備及其存儲(chǔ)介質(zhì)
- 神經(jīng)網(wǎng)絡(luò)的訓(xùn)練方法、裝置及存儲(chǔ)介質(zhì)
- 網(wǎng)絡(luò)管理方法和裝置
- 等級(jí)精細(xì)視力訓(xùn)練表
- 視覺(jué)盲點(diǎn)演示與旁中心注視訓(xùn)練儀
- 一種訓(xùn)練室
- 視覺(jué)盲點(diǎn)演示與旁中心注視訓(xùn)練儀
- 一種訓(xùn)練室
- 康復(fù)訓(xùn)練器及其定量訓(xùn)練方法和定量訓(xùn)練裝置
- 一種分布式訓(xùn)練中梯度同步方法及裝置
- 訓(xùn)練模型的訓(xùn)練時(shí)長(zhǎng)預(yù)測(cè)方法及裝置
- 一種模型訓(xùn)練方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 一種計(jì)算機(jī)輔助的自閉癥兒童情感社交康復(fù)訓(xùn)練系統(tǒng)





