[發(fā)明專利]模型訓(xùn)練的方法和裝置、電子設(shè)備和存儲介質(zhì)在審
| 申請?zhí)枺?/td> | 202011110813.8 | 申請日: | 2020-10-16 |
| 公開(公告)號: | CN112233665A | 公開(公告)日: | 2021-01-15 |
| 發(fā)明(設(shè)計)人: | 宋劍;白瑩;王橋;華洪香;孔進(jìn)亮;廖禛 | 申請(專利權(quán))人: | 珠海格力電器股份有限公司 |
| 主分類號: | G10L15/06 | 分類號: | G10L15/06;G10L15/16;G10L15/22;G10L15/26 |
| 代理公司: | 北京華夏泰和知識產(chǎn)權(quán)代理有限公司 11662 | 代理人: | 張麗穎;劉曉燕 |
| 地址: | 519070*** | 國省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 模型 訓(xùn)練 方法 裝置 電子設(shè)備 存儲 介質(zhì) | ||
本申請?zhí)峁┮环N模型訓(xùn)練的方法和裝置、電子設(shè)備和存儲介質(zhì),其中,該方法包括:獲取目標(biāo)對象輸入的目標(biāo)語音數(shù)據(jù),其中,目標(biāo)語音數(shù)據(jù)是與目標(biāo)指令匹配的語音數(shù)據(jù),目標(biāo)指令用于控制目標(biāo)設(shè)備執(zhí)行目標(biāo)操作;生成目標(biāo)語音樣本,其中,目標(biāo)語音樣本包括目標(biāo)語音數(shù)據(jù),與目標(biāo)語音數(shù)據(jù)對應(yīng)的、用于表示目標(biāo)指令的目標(biāo)標(biāo)注信息;使用目標(biāo)語音樣本對目標(biāo)設(shè)備上運行的第一語音識別模型進(jìn)行訓(xùn)練,得到第二語音識別模型。本申請可以適用不同用戶在不同場景下的語音數(shù)據(jù),進(jìn)而提高語音識別的準(zhǔn)確率,擴大應(yīng)用用戶群體。
技術(shù)領(lǐng)域
本申請涉及數(shù)據(jù)處理領(lǐng)域,尤其涉及一種模型訓(xùn)練的方法和裝置、電子設(shè)備和存儲介質(zhì)。
背景技術(shù)
當(dāng)下語音控制在家電產(chǎn)品中的應(yīng)用越來越廣泛,常見的語音控制包括語音喚醒和語音控制命令。其中,語音喚醒應(yīng)用領(lǐng)域比較廣泛,例如,應(yīng)用到機器人、手機、可穿戴設(shè)備、智能家居、車載等。很多帶有語音功能的設(shè)備,通常會將語音喚醒作為人機交互的開始或入口。
目前,語音識別系統(tǒng)的喚醒詞和控制命令僅適用開發(fā)前期訓(xùn)練好的語音識別模型,該語音識別模型對于不同用戶、不同場合所發(fā)出的語音的識別準(zhǔn)確度較低。
發(fā)明內(nèi)容
為了解決上述技術(shù)問題或者至少部分地解決上述技術(shù)問題,本申請?zhí)峁┝艘环N模型訓(xùn)練的方法和裝置、電子設(shè)備和存儲介質(zhì)。
根據(jù)本申請實施例的一個方面,提供了一種模型訓(xùn)練的方法,該方法包括:
獲取目標(biāo)對象輸入的目標(biāo)語音數(shù)據(jù),其中,目標(biāo)語音數(shù)據(jù)是與目標(biāo)指令匹配的語音數(shù)據(jù),目標(biāo)指令用于控制目標(biāo)設(shè)備執(zhí)行目標(biāo)操作;
生成目標(biāo)語音樣本,其中,目標(biāo)語音樣本包括目標(biāo)語音數(shù)據(jù),與目標(biāo)語音數(shù)據(jù)對應(yīng)的、用于表示目標(biāo)指令的目標(biāo)標(biāo)注信息;
使用目標(biāo)語音樣本對目標(biāo)設(shè)備上運行的第一語音識別模型進(jìn)行訓(xùn)練,得到第二語音識別模型。
可選地,在獲取目標(biāo)對象輸入的目標(biāo)語音數(shù)據(jù)之前,該方法還包括:
獲取目標(biāo)對象執(zhí)行的第一操作,其中,第一操作用于控制目標(biāo)設(shè)備內(nèi)進(jìn)入到模型訓(xùn)練模式,模型訓(xùn)練模式為根據(jù)獲取的語音數(shù)據(jù)對目標(biāo)設(shè)備上運行的第一語音識別模型進(jìn)行訓(xùn)練的模式。
可選地,在獲取目標(biāo)對象輸入的目標(biāo)語音數(shù)據(jù)之后,該方法還包括:
對目標(biāo)語音數(shù)據(jù)進(jìn)行語音識別,確定與目標(biāo)語音數(shù)據(jù)匹配的目標(biāo)指令。
可選地,對目標(biāo)語音數(shù)據(jù)進(jìn)行語音識別,確定與目標(biāo)語音數(shù)據(jù)匹配的目標(biāo)指令包括:
對目標(biāo)語音數(shù)據(jù)進(jìn)行語音識別,提取目標(biāo)語音數(shù)據(jù)內(nèi)的目標(biāo)關(guān)鍵詞;
獲取目標(biāo)關(guān)鍵詞與預(yù)設(shè)關(guān)鍵詞之間的相似度,其中,預(yù)設(shè)關(guān)鍵詞為與預(yù)設(shè)指令對應(yīng)的關(guān)鍵詞;
根據(jù)相似度,從預(yù)設(shè)指令中確定出與目標(biāo)語音數(shù)據(jù)匹配的目標(biāo)指令,其中,與目標(biāo)指令對應(yīng)的預(yù)設(shè)關(guān)鍵詞與目標(biāo)關(guān)鍵詞之間的相似度大于或者等于目標(biāo)相似度閾值。
可選地,在獲取目標(biāo)對象執(zhí)行的第一操作之后,該方法還包括:
獲取目標(biāo)對象執(zhí)行的第二操作,其中,第二操作用于將目標(biāo)語音數(shù)據(jù)與目標(biāo)指令相匹配,并從目標(biāo)語音數(shù)據(jù)中選取出目標(biāo)指令的目標(biāo)標(biāo)注信息。
可選地,該方法還包括:
獲取目標(biāo)對象執(zhí)行的第三操作,其中,第三操作用于控制進(jìn)入指令展示模式,指令展示模式用于展示目標(biāo)設(shè)備的控制指令;
響應(yīng)第三操作,依次播放目標(biāo)設(shè)備的多個控制指令中的各個控制指令、以及與各個控制指令對應(yīng)的語音回復(fù),其中,多個控制指令包括:用于喚醒目標(biāo)設(shè)備的喚醒指令,用于控制目標(biāo)設(shè)備執(zhí)行預(yù)設(shè)操作的控制指令。
根據(jù)本申請實施例的再一個方面,提供了一種模型訓(xùn)練的裝置,該裝置包括:
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于珠海格力電器股份有限公司,未經(jīng)珠海格力電器股份有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011110813.8/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





