[發(fā)明專利]語音區(qū)分模型訓(xùn)練方法、裝置、計(jì)算機(jī)設(shè)備及存儲(chǔ)介質(zhì)有效
| 申請(qǐng)?zhí)枺?/td> | 201810561701.0 | 申請(qǐng)日: | 2018-06-04 |
| 公開(公告)號(hào): | CN109065027B | 公開(公告)日: | 2023-05-02 |
| 發(fā)明(設(shè)計(jì))人: | 涂宏 | 申請(qǐng)(專利權(quán))人: | 平安科技(深圳)有限公司 |
| 主分類號(hào): | G10L15/06 | 分類號(hào): | G10L15/06;G10L25/30;G10L15/05 |
| 代理公司: | 深圳眾鼎專利商標(biāo)代理事務(wù)所(普通合伙) 44325 | 代理人: | 胡志桐 |
| 地址: | 518000 廣東省深*** | 國省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 語音 區(qū)分 模型 訓(xùn)練 方法 裝置 計(jì)算機(jī) 設(shè)備 存儲(chǔ) 介質(zhì) | ||
本發(fā)明公開了一種語音區(qū)分模型訓(xùn)練方法、裝置、計(jì)算機(jī)設(shè)備及存儲(chǔ)介質(zhì)。該方法包括:將標(biāo)準(zhǔn)訓(xùn)練語音數(shù)據(jù)和干擾訓(xùn)練語音數(shù)據(jù)輸入到原始雙向循環(huán)神經(jīng)網(wǎng)絡(luò)模型中進(jìn)行訓(xùn)練,調(diào)整原始雙向循環(huán)神經(jīng)網(wǎng)絡(luò)模型的權(quán)值和偏置,獲取原始語音區(qū)分模型;獲取待測(cè)試語音數(shù)據(jù),待測(cè)試語音數(shù)據(jù)包括等比例配置的標(biāo)準(zhǔn)測(cè)試語音數(shù)據(jù)和干擾測(cè)試語音數(shù)據(jù);將標(biāo)準(zhǔn)測(cè)試語音數(shù)據(jù)和干擾測(cè)試語音數(shù)據(jù)輸入到原始語音區(qū)分模型中進(jìn)行識(shí)別,獲取識(shí)別準(zhǔn)確率,若識(shí)別準(zhǔn)確率大于預(yù)設(shè)閾值,則原始語音區(qū)分模型確定為目標(biāo)語音區(qū)分模型。采用目標(biāo)語音區(qū)分模型對(duì)語音進(jìn)行區(qū)分,可以提高語音區(qū)分的準(zhǔn)確率。
技術(shù)領(lǐng)域
本發(fā)明涉及語音處理領(lǐng)域,尤其涉及一種語音區(qū)分模型訓(xùn)練方法、裝置、計(jì)算機(jī)設(shè)備及存儲(chǔ)介質(zhì)。
背景技術(shù)
一段未經(jīng)處理的語音數(shù)據(jù)一般包括標(biāo)準(zhǔn)語音和干擾語音,其中標(biāo)準(zhǔn)語音是指語音數(shù)據(jù)中聲紋連續(xù)變化明顯的語音部分(即純語音段),干擾語音可以是語音數(shù)據(jù)中由于靜默而沒有發(fā)音的語音數(shù)據(jù)(即靜音段),也可以是環(huán)境噪音部分(即噪音段)。語音區(qū)分是對(duì)輸入的語音數(shù)據(jù)進(jìn)行篩選,以保留對(duì)識(shí)別具有意義的標(biāo)準(zhǔn)語音。當(dāng)前主要采用端點(diǎn)檢測(cè)技術(shù)對(duì)語音數(shù)據(jù)進(jìn)行區(qū)分,這種語音區(qū)分方式,在標(biāo)準(zhǔn)語音中夾雜噪音時(shí),隨著噪音越大,進(jìn)行語音區(qū)分的難度越大,其端點(diǎn)檢測(cè)的識(shí)別結(jié)果越不準(zhǔn)確。因此,采用端點(diǎn)檢測(cè)技術(shù)進(jìn)行語音區(qū)分時(shí),其語音區(qū)分的識(shí)別結(jié)果容易受外部因素影響,使得語音區(qū)分結(jié)果不準(zhǔn)確。
發(fā)明內(nèi)容
基于此,有必要針對(duì)上述技術(shù)問題,提供一種使語音區(qū)分結(jié)果不易受外部因素影響的語音區(qū)分模型訓(xùn)練方法、裝置、設(shè)備及介質(zhì)。
一種語音區(qū)分模型訓(xùn)練方法,包括:
對(duì)雙向循環(huán)神經(jīng)網(wǎng)絡(luò)模型的權(quán)值和偏置進(jìn)行初始化處理,獲取原始雙向循環(huán)神經(jīng)網(wǎng)絡(luò)模型;
獲取待訓(xùn)練語音數(shù)據(jù),所述待訓(xùn)練語音數(shù)據(jù)包括等比例配置的標(biāo)準(zhǔn)訓(xùn)練語音數(shù)據(jù)和干擾訓(xùn)練語音數(shù)據(jù);
將所述標(biāo)準(zhǔn)訓(xùn)練語音數(shù)據(jù)和所述干擾訓(xùn)練語音數(shù)據(jù)輸入到原始雙向循環(huán)神經(jīng)網(wǎng)絡(luò)模型中進(jìn)行訓(xùn)練,調(diào)整所述原始雙向循環(huán)神經(jīng)網(wǎng)絡(luò)模型的權(quán)值和偏置,獲取原始語音區(qū)分模型;
獲取待測(cè)試語音數(shù)據(jù),所述待測(cè)試語音數(shù)據(jù)包括等比例配置的標(biāo)準(zhǔn)測(cè)試語音數(shù)據(jù)和干擾測(cè)試語音數(shù)據(jù);
將所述標(biāo)準(zhǔn)測(cè)試語音數(shù)據(jù)和干擾測(cè)試語音數(shù)據(jù)輸入到原始語音區(qū)分模型中進(jìn)行識(shí)別,獲取所述標(biāo)準(zhǔn)測(cè)試語音數(shù)據(jù)或者干擾測(cè)試語音數(shù)據(jù)對(duì)應(yīng)的識(shí)別準(zhǔn)確率,若所述識(shí)別準(zhǔn)確率大于預(yù)設(shè)閾值,則所述原始語音區(qū)分模型確定為目標(biāo)語音區(qū)分模型。
一種語音模型訓(xùn)練裝置,包括:
模型初始化模塊,用于對(duì)雙向循環(huán)神經(jīng)網(wǎng)絡(luò)模型的權(quán)值和偏置進(jìn)行初始化處理,獲取原始雙向循環(huán)神經(jīng)網(wǎng)絡(luò)模型;
待訓(xùn)練語音數(shù)據(jù)獲取模塊,用于獲取待訓(xùn)練語音數(shù)據(jù),所述待訓(xùn)練語音數(shù)據(jù)包括等比例配置的標(biāo)準(zhǔn)訓(xùn)練語音數(shù)據(jù)和干擾訓(xùn)練語音數(shù)據(jù);
模型訓(xùn)練模塊,用于將所述標(biāo)準(zhǔn)訓(xùn)練語音數(shù)據(jù)和所述干擾訓(xùn)練語音數(shù)據(jù)輸入到原始雙向循環(huán)神經(jīng)網(wǎng)絡(luò)模型中進(jìn)行訓(xùn)練,調(diào)整所述原始雙向循環(huán)神經(jīng)網(wǎng)絡(luò)模型的權(quán)值和偏置,獲取原始語音區(qū)分模型;
待測(cè)試語音數(shù)據(jù)獲取模塊,用于獲取待測(cè)試語音數(shù)據(jù),所述待測(cè)試語音數(shù)據(jù)包括等比例配置的標(biāo)準(zhǔn)測(cè)試語音數(shù)據(jù)和干擾測(cè)試語音數(shù)據(jù);
模型獲取模塊,用于將所述標(biāo)準(zhǔn)測(cè)試語音數(shù)據(jù)和干擾測(cè)試語音數(shù)據(jù)輸入到原始語音區(qū)分模型中進(jìn)行識(shí)別,獲取所述標(biāo)準(zhǔn)測(cè)試語音數(shù)據(jù)或者干擾測(cè)試語音數(shù)據(jù)對(duì)應(yīng)的識(shí)別準(zhǔn)確率,若所述識(shí)別準(zhǔn)確率大于預(yù)設(shè)閾值,則所述原始語音區(qū)分模型確定為目標(biāo)語音區(qū)分模型。
一種計(jì)算機(jī)設(shè)備,包括存儲(chǔ)器、處理器以及存儲(chǔ)在所述存儲(chǔ)器中并可在所述處理器上運(yùn)行的計(jì)算機(jī)程序,所述處理器執(zhí)行所述計(jì)算機(jī)程序時(shí)實(shí)現(xiàn)所述語音區(qū)分模型訓(xùn)練方法的步驟。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于平安科技(深圳)有限公司,未經(jīng)平安科技(深圳)有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810561701.0/2.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。





