[發(fā)明專利]語(yǔ)音模型訓(xùn)練方法、語(yǔ)音識(shí)別方法、裝置、設(shè)備及介質(zhì)在審
| 申請(qǐng)?zhí)枺?/td> | 201810551458.4 | 申請(qǐng)日: | 2018-05-31 |
| 公開(公告)號(hào): | CN108922515A | 公開(公告)日: | 2018-11-30 |
| 發(fā)明(設(shè)計(jì))人: | 涂宏 | 申請(qǐng)(專利權(quán))人: | 平安科技(深圳)有限公司 |
| 主分類號(hào): | G10L15/06 | 分類號(hào): | G10L15/06;G10L15/02;G10L25/18;G10L25/24;G10L25/30;G10L25/45 |
| 代理公司: | 深圳眾鼎專利商標(biāo)代理事務(wù)所(普通合伙) 44325 | 代理人: | 譚果林 |
| 地址: | 518000 廣東省深*** | 國(guó)省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 語(yǔ)音模型 目標(biāo)語(yǔ)音 訓(xùn)練語(yǔ)音 獲取目標(biāo) 關(guān)聯(lián)存儲(chǔ) 目標(biāo)背景 聲紋特征 語(yǔ)音識(shí)別 語(yǔ)音特征 數(shù)據(jù)提取目標(biāo) 自適應(yīng)處理 神經(jīng)網(wǎng)絡(luò) 數(shù)據(jù)提取 特征獲取 特征識(shí)別 特征輸入 語(yǔ)音數(shù)據(jù) 數(shù)據(jù)庫(kù) 語(yǔ)音 | ||
本發(fā)明公開了一種語(yǔ)音模型訓(xùn)練方法、語(yǔ)音識(shí)別方法、裝置、設(shè)備及介質(zhì)。該語(yǔ)音模型訓(xùn)練方法包括:獲取訓(xùn)練語(yǔ)音數(shù)據(jù),基于所述訓(xùn)練語(yǔ)音數(shù)據(jù)提取訓(xùn)練語(yǔ)音特征;基于所述訓(xùn)練語(yǔ)音特征獲取目標(biāo)背景模型;獲取目標(biāo)語(yǔ)音數(shù)據(jù),基于所述目標(biāo)語(yǔ)音數(shù)據(jù)提取目標(biāo)語(yǔ)音特征;采用所述目標(biāo)背景模型對(duì)所述目標(biāo)語(yǔ)音特征進(jìn)行自適應(yīng)處理,獲取目標(biāo)聲紋特征識(shí)別模型;將所述目標(biāo)語(yǔ)音特征輸入到深度神經(jīng)網(wǎng)絡(luò)中進(jìn)行訓(xùn)練,獲取目標(biāo)語(yǔ)音特征識(shí)別模型;將所述目標(biāo)聲紋特征識(shí)別模型和所述目標(biāo)語(yǔ)音特征識(shí)別模型關(guān)聯(lián)存儲(chǔ)在數(shù)據(jù)庫(kù)中。采用該語(yǔ)音模型訓(xùn)練方法得到的關(guān)聯(lián)存儲(chǔ)的語(yǔ)音模型,能夠達(dá)到精確識(shí)別語(yǔ)音的效果。
技術(shù)領(lǐng)域
本發(fā)明涉及語(yǔ)音識(shí)別技術(shù)領(lǐng)域,尤其涉及一種語(yǔ)音模型訓(xùn)練方法、語(yǔ)音識(shí)別方法、裝置、設(shè)備及介質(zhì)。
背景技術(shù)
目前在進(jìn)行語(yǔ)音識(shí)別時(shí),大多數(shù)都是根據(jù)語(yǔ)音特征進(jìn)行識(shí)別,這些語(yǔ)音特征有的維度太高,包含太多非關(guān)鍵信息;有的維度太低,不能充分體現(xiàn)語(yǔ)音的特點(diǎn),使得當(dāng)前語(yǔ)音識(shí)別精確度較低,無法對(duì)語(yǔ)音進(jìn)行有效的識(shí)別,制約了語(yǔ)音識(shí)別的應(yīng)用。
發(fā)明內(nèi)容
本發(fā)明實(shí)施例提供一種語(yǔ)音模型訓(xùn)練方法、裝置、設(shè)備及介質(zhì),以解決當(dāng)前語(yǔ)音識(shí)別準(zhǔn)確度較低的問題。
一種語(yǔ)音模型訓(xùn)練方法,包括:
獲取訓(xùn)練語(yǔ)音數(shù)據(jù),基于所述訓(xùn)練語(yǔ)音數(shù)據(jù)提取訓(xùn)練語(yǔ)音特征;
基于所述訓(xùn)練語(yǔ)音特征獲取目標(biāo)背景模型;
獲取目標(biāo)語(yǔ)音數(shù)據(jù),基于所述目標(biāo)語(yǔ)音數(shù)據(jù)提取目標(biāo)語(yǔ)音特征;
采用所述目標(biāo)背景模型對(duì)所述目標(biāo)語(yǔ)音特征進(jìn)行自適應(yīng)處理,獲取目標(biāo)聲紋特征識(shí)別模型;
將所述目標(biāo)語(yǔ)音特征輸入到深度神經(jīng)網(wǎng)絡(luò)中進(jìn)行訓(xùn)練,獲取目標(biāo)語(yǔ)音特征識(shí)別模型;
將所述目標(biāo)聲紋特征識(shí)別模型和所述目標(biāo)語(yǔ)音特征識(shí)別模型關(guān)聯(lián)存儲(chǔ)在數(shù)據(jù)庫(kù)中。
一種語(yǔ)音模型訓(xùn)練裝置,包括:
訓(xùn)練語(yǔ)音特征提取模塊,用于獲取訓(xùn)練語(yǔ)音數(shù)據(jù),基于所述訓(xùn)練語(yǔ)音數(shù)據(jù)提取訓(xùn)練語(yǔ)音特征;
目標(biāo)背景模型獲取模塊,用于基于所述訓(xùn)練語(yǔ)音特征獲取目標(biāo)背景模型;
目標(biāo)語(yǔ)音特征提取模塊,用于獲取目標(biāo)語(yǔ)音數(shù)據(jù),基于所述目標(biāo)語(yǔ)音數(shù)據(jù)提取目標(biāo)語(yǔ)音特征;
目標(biāo)聲紋特征識(shí)別模型獲取模塊,用于采用所述目標(biāo)背景模型對(duì)所述目標(biāo)語(yǔ)音特征進(jìn)行自適應(yīng)處理,獲取目標(biāo)聲紋特征識(shí)別模型;
語(yǔ)音特征識(shí)別獲取模塊,用于將所述目標(biāo)語(yǔ)音特征輸入到深度神經(jīng)網(wǎng)絡(luò)中進(jìn)行訓(xùn)練,獲取目標(biāo)語(yǔ)音特征識(shí)別模型;
模型存儲(chǔ)模塊,用于將所述目標(biāo)聲紋特征識(shí)別模型和所述目標(biāo)語(yǔ)音特征識(shí)別模型關(guān)聯(lián)存儲(chǔ)在數(shù)據(jù)庫(kù)中。
一種計(jì)算機(jī)設(shè)備,包括存儲(chǔ)器、處理器以及存儲(chǔ)在所述存儲(chǔ)器中并可在所述處理器上運(yùn)行的計(jì)算機(jī)程序,所述處理器執(zhí)行所述計(jì)算機(jī)程序時(shí)實(shí)現(xiàn)所述語(yǔ)音模型訓(xùn)練方法的步驟。
一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),所述計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)存儲(chǔ)有計(jì)算機(jī)程序,所述計(jì)算機(jī)程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)所述語(yǔ)音模型訓(xùn)練方法的步驟。
本發(fā)明實(shí)施例提供一種語(yǔ)音識(shí)別方法、裝置、設(shè)備及介質(zhì),以解決當(dāng)前語(yǔ)音識(shí)別準(zhǔn)確度較低的問題。
一種語(yǔ)音識(shí)別方法,包括:
獲取待識(shí)別語(yǔ)音數(shù)據(jù),所述待識(shí)別語(yǔ)音數(shù)據(jù)與用戶標(biāo)識(shí)相關(guān)聯(lián);
基于所述用戶標(biāo)識(shí)查詢數(shù)據(jù)庫(kù),獲取關(guān)聯(lián)存儲(chǔ)的目標(biāo)聲紋特征識(shí)別模型和目標(biāo)語(yǔ)音特征識(shí)別模型,所述目標(biāo)聲紋特征識(shí)別模型和所述目標(biāo)語(yǔ)音特征識(shí)別模型是采用所述語(yǔ)音模型訓(xùn)練方法獲取的語(yǔ)音模型;
基于所述待識(shí)別語(yǔ)音數(shù)據(jù),提取待識(shí)別語(yǔ)音特征;
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于平安科技(深圳)有限公司,未經(jīng)平安科技(深圳)有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810551458.4/2.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 語(yǔ)音模型訓(xùn)練方法、語(yǔ)音識(shí)別方法、裝置、設(shè)備及介質(zhì)
- 一種語(yǔ)音翻譯模型的訓(xùn)練方法及裝置
- 語(yǔ)音處理模型的訓(xùn)練方法、語(yǔ)音識(shí)別方法、系統(tǒng)及裝置
- 一種模型訓(xùn)練的方法、語(yǔ)音播放的方法、裝置及存儲(chǔ)介質(zhì)
- 語(yǔ)音合成模型的訓(xùn)練方法、裝置、存儲(chǔ)介質(zhì)以及電子設(shè)備
- 語(yǔ)音合成模型訓(xùn)練及語(yǔ)音合成方法、裝置及語(yǔ)音合成器
- 翻譯模型的訓(xùn)練方法、翻譯方法、電子設(shè)備、存儲(chǔ)介質(zhì)
- 語(yǔ)音識(shí)別模型的訓(xùn)練與語(yǔ)音識(shí)別的方法、裝置
- 語(yǔ)音識(shí)別模型的訓(xùn)練方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 語(yǔ)音識(shí)別、模型訓(xùn)練方法、裝置、電子設(shè)備和存儲(chǔ)介質(zhì)
- 一種語(yǔ)音掩蔽方法和設(shè)備
- 一種語(yǔ)音信號(hào)處理方法、裝置、終端設(shè)備及介質(zhì)
- 語(yǔ)音模型訓(xùn)練方法、語(yǔ)音識(shí)別方法、裝置、設(shè)備及介質(zhì)
- 一種語(yǔ)音意圖識(shí)別方法及裝置
- 一種語(yǔ)音識(shí)別、及語(yǔ)音識(shí)別模型訓(xùn)練方法及裝置
- 語(yǔ)音分類方法、裝置、設(shè)備及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)
- 語(yǔ)音識(shí)別測(cè)試方法、裝置、設(shè)備及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)
- 模型訓(xùn)練的方法和裝置、電子設(shè)備和存儲(chǔ)介質(zhì)
- 一種語(yǔ)音意圖識(shí)別方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 語(yǔ)音數(shù)據(jù)處理方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)
- 一種可學(xué)習(xí)動(dòng)作的語(yǔ)音控制機(jī)器人系統(tǒng)
- 一種語(yǔ)音識(shí)別方法及裝置
- 語(yǔ)音合成模型的訓(xùn)練方法、裝置、計(jì)算機(jī)設(shè)備及存儲(chǔ)介質(zhì)
- 語(yǔ)音轉(zhuǎn)換的方法及訓(xùn)練方法、智能裝置和存儲(chǔ)介質(zhì)
- 語(yǔ)音處理裝置、設(shè)備及其訓(xùn)練方法
- 語(yǔ)音識(shí)別和語(yǔ)音模型訓(xùn)練的方法及存儲(chǔ)介質(zhì)和電子設(shè)備
- 一種模型訓(xùn)練的方法、語(yǔ)音播放的方法、裝置及存儲(chǔ)介質(zhì)
- 語(yǔ)音識(shí)別模型訓(xùn)練方法、語(yǔ)音識(shí)別方法及相關(guān)裝置
- 語(yǔ)音活動(dòng)檢測(cè)模型訓(xùn)練、語(yǔ)音活動(dòng)檢測(cè)方法及相關(guān)裝置
- 用于識(shí)別連續(xù)和分立語(yǔ)音的語(yǔ)音識(shí)別系統(tǒng)





