[發明專利]喚醒方法、裝置及電子設備在審
| 申請號: | 202010697533.5 | 申請日: | 2020-07-20 |
| 公開(公告)號: | CN111883121A | 公開(公告)日: | 2020-11-03 |
| 發明(設計)人: | 陳孝良;馮大航;靳源 | 申請(專利權)人: | 北京聲智科技有限公司 |
| 主分類號: | G10L15/22 | 分類號: | G10L15/22;G10L15/14;G10L15/06 |
| 代理公司: | 北京竹辰知識產權代理事務所(普通合伙) 11706 | 代理人: | 聶鵬 |
| 地址: | 100080 北京市*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 喚醒 方法 裝置 電子設備 | ||
本公開實施例公開了一種喚醒方法、裝置、電子設備和計算機可讀存儲介質。其中該喚醒方法包括:獲取語音中的喚醒詞;將所述喚醒詞輸入喚醒模型中,通過所述喚醒模型得到所述喚醒詞的特征的后驗概率;獲取所述喚醒詞的解碼圖;根據維特比算法使用所述后驗概率在所述解碼圖中進行搜索,得到對應喚醒詞路徑得分和垃圾詞路徑得分;計算所述喚醒詞路徑得分和垃圾詞路徑得分的差值作為喚醒置信度;當所述喚醒置信度高于喚醒閾值,執行喚醒操作。上述方法通過對路徑得分的差值,可以得到喚醒置信度,使得喚醒置信度更加準確,解決了喚醒不準確的技術問題。
技術領域
本公開涉及語音喚醒領域,尤其涉及一種喚醒方法、裝置、電子設備及計算機可讀存儲介質。
背景技術
作為一種人機交互的手段,語音交互技術在解放人類雙手方面意義重大。隨著各種智能設備的出現,語音交互成為了互聯網入口的新價值所在,越來越多的智能設備加入了語音喚醒的潮流,成為人與設備溝通的橋梁。
目前越來越多的設備可以使用語音來控制,比如典型的智能手機、智能音箱等。除了上述智能終端設備,很多大型的設備也可以使用語音來控制,如電梯等。
語音控制包括很多命令詞,目前多數的做法是給用戶提供喚醒詞,當用戶說出喚醒詞且系統識別出喚醒詞之后,執行對應的功能。但是目前的喚醒詞識別準確度不夠,常常會出現識別不準確的問題,導致無法喚醒或者誤喚醒。
發明內容
提供該發明內容部分以便以簡要的形式介紹構思,這些構思將在后面的具體實施方式部分被詳細描述。該發明內容部分并不旨在標識要求保護的技術方案的關鍵特征或必要特征,也不旨在用于限制所要求的保護的技術方案的范圍。
為了解決現有技術中用戶無法設置喚醒詞的技術問題,本公開提供了以下技術方案。
第一方面,本公開實施例提供一種喚醒方法,包括:
獲取語音中的喚醒詞;
將所述喚醒詞輸入喚醒模型中,通過所述喚醒模型得到所述喚醒詞的特征的后驗概率;
獲取所述喚醒詞的解碼圖;
根據維特比算法使用所述后驗概率在所述解碼圖中進行搜索,得到對應喚醒詞路徑得分和垃圾詞路徑得分;
計算所述喚醒詞路徑得分和垃圾詞路徑得分的差值作為喚醒置信度;
當所述喚醒置信度高于喚醒閾值,執行喚醒操作。
進一步的,在接收喚醒詞之前還包括:
接收待設置成喚醒詞的語句;
根據發音詞典將所述語句解析為多個音素;
獲取所述多個音素所對應的多個HMM,其中所述多個HMM與所述多個音素一一對應;
根據所述多個HMM構成所述語句的識別路徑。
進一步的,所述喚醒模型通過以下步驟訓練得到:
提取訓練集合中的語音樣本的特征;
使用識別模型對所述語音樣本的特征進行對齊得到所述語音樣本的特征的第一標簽;
根據問題集建立所有第一標簽的決策樹;
根據所述決策樹將所述第一標簽轉換成第二標簽;
根據所述語音樣本的第二標簽以及所述語音樣本的特征訓練所述喚醒模型。
進一步的,所述根據所述語音樣本的第二標簽以及所述語音樣本的特征訓練所述喚醒模型,包括:
初始化所述喚醒模型的參數;
將所述語音樣本的特征輸入所述喚醒模型中;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京聲智科技有限公司,未經北京聲智科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010697533.5/2.html,轉載請聲明來源鉆瓜專利網。





