[發(fā)明專利]模型訓(xùn)練方法、裝置、電子設(shè)備及存儲介質(zhì)在審
| 申請?zhí)枺?/td> | 202010575643.4 | 申請日: | 2020-06-22 |
| 公開(公告)號: | CN111883164A | 公開(公告)日: | 2020-11-03 |
| 發(fā)明(設(shè)計(jì))人: | 張旭;鄭羲光;張晨 | 申請(專利權(quán))人: | 北京達(dá)佳互聯(lián)信息技術(shù)有限公司 |
| 主分類號: | G10L21/0232 | 分類號: | G10L21/0232;G10L25/30;G06N3/08 |
| 代理公司: | 北京潤澤恒知識產(chǎn)權(quán)代理有限公司 11319 | 代理人: | 李娜 |
| 地址: | 100085 北京市海淀*** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 模型 訓(xùn)練 方法 裝置 電子設(shè)備 存儲 介質(zhì) | ||
本公開關(guān)于一種模型訓(xùn)練方法、裝置、電子設(shè)備及存儲介質(zhì),訓(xùn)練方法包括獲取多個樣本數(shù)據(jù),根據(jù)樣本數(shù)據(jù)中的原始音頻數(shù)據(jù)和帶噪音頻數(shù)據(jù),確定每個樣本數(shù)據(jù)中的帶噪音頻數(shù)據(jù)在各個采樣點(diǎn)的第一特征信息和幅度特征信息。調(diào)整第一特征信息以得到目標(biāo)特征信息,根據(jù)目標(biāo)特征信息和對應(yīng)的幅度特征信息對待訓(xùn)練模型進(jìn)行訓(xùn)練,獲得訓(xùn)練好的模型。在通過訓(xùn)練好的模型對音頻數(shù)據(jù)進(jìn)行去噪時(shí),在較低的信噪比范圍時(shí)可以增強(qiáng)模型的去噪強(qiáng)度,在較高的信噪比范圍時(shí)可以降低模型的去噪強(qiáng)度,可以使訓(xùn)練好的模型針對不同信噪比范圍內(nèi)的音頻數(shù)據(jù),獲得不同的去噪效果。
技術(shù)領(lǐng)域
本公開涉及計(jì)算機(jī)技術(shù)領(lǐng)域,尤其涉及一種模型訓(xùn)練方法、裝置、電子設(shè)備及存儲介質(zhì)。
背景技術(shù)
隨著計(jì)算機(jī)技術(shù)的發(fā)展,神經(jīng)網(wǎng)絡(luò)越來越多的被運(yùn)用到音頻數(shù)據(jù)的處理中,相比于傳統(tǒng)算法,神經(jīng)網(wǎng)絡(luò)往往能獲得更好的效果和性能。在音頻數(shù)據(jù)的去噪過程中,首先對待訓(xùn)練模型進(jìn)行訓(xùn)練,得到訓(xùn)練好的模型,然后通過訓(xùn)練好的模型對音頻數(shù)據(jù)進(jìn)行去噪,得到去除噪聲數(shù)據(jù)后的音頻數(shù)據(jù)。
在待訓(xùn)練模型的訓(xùn)練過程中,樣本數(shù)據(jù)是隨機(jī)的,樣本數(shù)據(jù)可以是信噪較低的音頻數(shù)據(jù)或信噪比較高的音頻數(shù)據(jù),由隨機(jī)樣本數(shù)據(jù)訓(xùn)練得到的模型,無法針對不同信噪比范圍的音頻數(shù)據(jù),采用不同的去噪強(qiáng)度進(jìn)行去噪。
發(fā)明內(nèi)容
本公開提供一種模型訓(xùn)練方法、裝置、電子設(shè)備及存儲介質(zhì),以至少解決在音頻數(shù)據(jù)的去噪過程中,模型無法針對不同信噪比范圍的音頻數(shù)據(jù),采用不同的去噪強(qiáng)度進(jìn)行去噪的問題。
本公開的技術(shù)方案如下:
根據(jù)本公開實(shí)施例的第一方面,提供一種模型訓(xùn)練方法,包括:
獲取多個樣本數(shù)據(jù),每個所述樣本數(shù)據(jù)包括原始音頻數(shù)據(jù)和帶噪音頻數(shù)據(jù);
根據(jù)所述原始音頻數(shù)據(jù)和帶噪音頻數(shù)據(jù),確定每個樣本數(shù)據(jù)中的帶噪音頻數(shù)據(jù)在各個采樣點(diǎn)的第一特征信息和幅度特征信息,所述第一特征信息用于表示所述帶噪音頻數(shù)據(jù)在相應(yīng)采樣點(diǎn)的信噪比信息;
調(diào)整所述第一特征信息以得到目標(biāo)特征信息;其中,當(dāng)所述第一特征信息小于等于第一閾值時(shí),減小所述第一特征信息,當(dāng)所述第一特征信息大于等于第二閾值時(shí),增大所述第一特征信息,所述第一閾值小于所述第二閾值;
將所述幅度特征信息輸入待訓(xùn)練模型中,得到所述待訓(xùn)練模型輸出的第二特征信息;
根據(jù)所述第二特征信息和所述目標(biāo)特征信息,獲取所述待訓(xùn)練模型的損失值;
根據(jù)所述損失值調(diào)整所述待訓(xùn)練模型的模型參數(shù),直至損失值小于等于預(yù)設(shè)閾值時(shí),將所述待訓(xùn)練模型作為訓(xùn)練好的模型。
可選的,所述調(diào)整所述第一特征信息以得到目標(biāo)特征信息,包括:
當(dāng)所述第一特征信息小于等于所述第一閾值時(shí),將所述第一特征信息減小到第三閾值以下;
當(dāng)所述第一特征信息大于等于所述第二閾值時(shí),將所述第一特征信息增大到第四閾值以上。
可選的,還包括:當(dāng)所述第一特征信息大于所述第一閾值、且小于所述第二閾值時(shí),將所述第一特征信息調(diào)整到第五閾值至第六閾值之間,所述第五閾值小于所述第六閾值。
可選的,所述調(diào)整所述第一特征信息以得到目標(biāo)特征信息,包括:通過映射函數(shù)對所述第一特征信息進(jìn)行調(diào)整,以得到所述目標(biāo)特征信息。
可選的,所述第一特征信息為所述采樣點(diǎn)對應(yīng)的所述原始音頻數(shù)據(jù)的幅度值與所述帶噪音頻數(shù)據(jù)的幅度值之間的比值,所述第一特征信息小于等于1。
可選的,所述根據(jù)所述原始音頻數(shù)據(jù)和帶噪音頻數(shù)據(jù),確定每個樣本數(shù)據(jù)中的帶噪音頻數(shù)據(jù)在各個采樣點(diǎn)的第一特征信息和幅度特征信息,包括:
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于北京達(dá)佳互聯(lián)信息技術(shù)有限公司,未經(jīng)北京達(dá)佳互聯(lián)信息技術(shù)有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010575643.4/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





