[發(fā)明專利]喚醒方法、裝置及電子設(shè)備在審
| 申請(qǐng)?zhí)枺?/td> | 202010697533.5 | 申請(qǐng)日: | 2020-07-20 |
| 公開(公告)號(hào): | CN111883121A | 公開(公告)日: | 2020-11-03 |
| 發(fā)明(設(shè)計(jì))人: | 陳孝良;馮大航;靳源 | 申請(qǐng)(專利權(quán))人: | 北京聲智科技有限公司 |
| 主分類號(hào): | G10L15/22 | 分類號(hào): | G10L15/22;G10L15/14;G10L15/06 |
| 代理公司: | 北京竹辰知識(shí)產(chǎn)權(quán)代理事務(wù)所(普通合伙) 11706 | 代理人: | 聶鵬 |
| 地址: | 100080 北京市*** | 國(guó)省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 喚醒 方法 裝置 電子設(shè)備 | ||
1.一種喚醒方法,其特征在于,包括:
獲取語(yǔ)音中的喚醒詞;
將所述喚醒詞輸入喚醒模型中,通過所述喚醒模型得到所述喚醒詞的特征的后驗(yàn)概率;
獲取所述喚醒詞的解碼圖;
根據(jù)維特比算法使用所述后驗(yàn)概率在所述解碼圖中進(jìn)行搜索,得到對(duì)應(yīng)喚醒詞路徑得分和垃圾詞路徑得分;
計(jì)算所述喚醒詞路徑得分和垃圾詞路徑得分的差值作為喚醒置信度;
當(dāng)所述喚醒置信度高于喚醒閾值,執(zhí)行喚醒操作。
2.如權(quán)利要求1所述的喚醒方法,其特征在于,在接收喚醒詞之前還包括:
接收待設(shè)置成喚醒詞的語(yǔ)句;
根據(jù)發(fā)音詞典將所述語(yǔ)句解析為多個(gè)音素;
獲取所述多個(gè)音素所對(duì)應(yīng)的多個(gè)HMM,其中所述多個(gè)HMM與所述多個(gè)音素一一對(duì)應(yīng);
根據(jù)所述多個(gè)HMM構(gòu)成所述語(yǔ)句的識(shí)別路徑。
3.如權(quán)利要求1所述的喚醒方法,其特征在于,所述喚醒模型通過以下步驟訓(xùn)練得到:
提取訓(xùn)練集合中的語(yǔ)音樣本的特征;
使用識(shí)別模型對(duì)所述語(yǔ)音樣本的特征進(jìn)行對(duì)齊得到所述語(yǔ)音樣本的特征的第一標(biāo)簽;
根據(jù)問題集建立所有第一標(biāo)簽的決策樹;
根據(jù)所述決策樹將所述第一標(biāo)簽轉(zhuǎn)換成第二標(biāo)簽;
根據(jù)所述語(yǔ)音樣本的第二標(biāo)簽以及所述語(yǔ)音樣本的特征訓(xùn)練所述喚醒模型。
4.如權(quán)利要求3所述的喚醒方法,其特征在于,所述根據(jù)所述語(yǔ)音樣本的第二標(biāo)簽以及所述語(yǔ)音樣本的特征訓(xùn)練所述喚醒模型,包括:
初始化所述喚醒模型的參數(shù);
將所述語(yǔ)音樣本的特征輸入所述喚醒模型中;
所述喚醒模型根據(jù)所述語(yǔ)音樣本的特征生成所述語(yǔ)音樣本的特征的分類結(jié)果為所述第二標(biāo)簽的概率值;
根據(jù)所述概率值以及所述語(yǔ)音樣本的第二標(biāo)簽更新所述喚醒模型的參數(shù);
繼續(xù)將所述語(yǔ)音樣本的特征輸入所述喚醒模型中迭代上述參數(shù)更新過程直至達(dá)到收斂條件。
5.如權(quán)利要求4所述的喚醒方法,其特征在于,所述根據(jù)所述概率值以及所述語(yǔ)音樣本的第二標(biāo)簽更新所述喚醒模型的參數(shù),包括:
根據(jù)所述概率值以及所述語(yǔ)音樣本的第二標(biāo)簽的交叉熵更新所述喚醒模型的參數(shù)。
6.如權(quán)利要求4所述的喚醒方法,其特征在于,所述根據(jù)所述概率值以及所述語(yǔ)音樣本的第二標(biāo)簽更新所述喚醒模型的參數(shù),包括:
根據(jù)所述概率值以及所述語(yǔ)音樣本的第二標(biāo)簽通過EM算法更新所述喚醒模型的參數(shù)。
7.一種喚醒方法,其特征在于,包括:
獲取喚醒語(yǔ)音;
逐幀提取所述喚醒語(yǔ)音的特征;
使用多喚醒詞識(shí)別模型逐幀進(jìn)行前向計(jì)算得到所述多喚醒詞識(shí)別模型輸出的后驗(yàn)概率;
根據(jù)所述后驗(yàn)概率計(jì)算所述喚醒語(yǔ)音的置信度;
當(dāng)所述喚醒語(yǔ)音的置信度大于喚醒閾值時(shí),執(zhí)行喚醒操作。
8.如權(quán)利要求7所述的喚醒方法,其特征在于,所述根據(jù)所述后驗(yàn)概率計(jì)算所述喚醒語(yǔ)音的置信度,包括:
對(duì)所述后驗(yàn)概率進(jìn)行加窗平滑得到多個(gè)平滑后驗(yàn)概率;
計(jì)算所述多個(gè)平滑后驗(yàn)概率的幾何平均值作為所述喚醒語(yǔ)音的置信度。
9.如權(quán)利要求7所述的喚醒方法,其特征在于,所述根據(jù)所述后驗(yàn)概率計(jì)算所述喚醒語(yǔ)音的置信度,包括:
獲取所述喚醒語(yǔ)音的解碼圖;
使用維特比算法根據(jù)所述后驗(yàn)概率所述解碼圖得到喚醒語(yǔ)音的最優(yōu)路徑的得分以及垃圾詞路徑的得分;
將所述最優(yōu)路徑的得分和垃圾詞路徑的得分的差值作為所述喚醒語(yǔ)音的置信度。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于北京聲智科技有限公司,未經(jīng)北京聲智科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010697533.5/1.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 一種數(shù)據(jù)庫(kù)讀寫分離的方法和裝置
- 一種手機(jī)動(dòng)漫人物及背景創(chuàng)作方法
- 一種通訊綜合測(cè)試終端的測(cè)試方法
- 一種服裝用人體測(cè)量基準(zhǔn)點(diǎn)的獲取方法
- 系統(tǒng)升級(jí)方法及裝置
- 用于虛擬和接口方法調(diào)用的裝置和方法
- 線程狀態(tài)監(jiān)控方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)
- 一種JAVA智能卡及其虛擬機(jī)組件優(yōu)化方法
- 檢測(cè)程序中方法耗時(shí)的方法、裝置及存儲(chǔ)介質(zhì)
- 函數(shù)的執(zhí)行方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)





