[發明專利]電子設備喚醒方法、裝置、電子設備及存儲介質有效
| 申請號: | 202010564571.3 | 申請日: | 2020-06-19 |
| 公開(公告)號: | CN111739521B | 公開(公告)日: | 2021-06-22 |
| 發明(設計)人: | 陳杰;蘇丹 | 申請(專利權)人: | 騰訊科技(深圳)有限公司 |
| 主分類號: | G10L15/08 | 分類號: | G10L15/08;G10L15/06;G10L15/14;G10L15/18;G10L15/22;G10L25/03;G10L25/30 |
| 代理公司: | 北京派特恩知識產權代理有限公司 11270 | 代理人: | 崔曉嵐;張穎玲 |
| 地址: | 518000 廣東省深圳*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 電子設備 喚醒 方法 裝置 存儲 介質 | ||
本發明提供了一種電子設備喚醒方法,包括:獲取測試語音集合,并通過聲音處理模型中的第一神經網絡提取對應的測試語音特征集合;通過所述聲音處理模型中的第一神經網絡,基于所述測試語音特征集合,確定相應的測試特征;獲取喚醒語音特征集合,并通過聲音處理模型中的第一神經網絡提取對應的喚醒詞特征;根據所述測試特征和所述喚醒詞特征,通過所述聲音處理模型中的第二神經網絡進行喚醒判決,由此可以實現基于所述喚醒判決的結果,通過電子設備執行與喚醒語音特征相匹配的任務,有效地降低計算復雜度提升響應速度,提升電子設備的喚醒性能,擴大了喚醒方案的適用場景,提升聲音處理模型的魯棒性和泛化能力。
技術領域
本發明涉及語音識別技術,尤其涉及電子設備喚醒方法、裝置、電子設備及存儲介質。
背景技術
語音技術(Speech Technology)的關鍵技術有自動語音識別技術(ASRAutomaticSpeech Recognition)和文字語音轉換技術(TTS Test-to-speech)以及聲紋識別技術。讓計算機能聽、能看、能說、能感覺,是未來人機交互的發展方向,其中語音成為最為便捷的人機交互方式之一。將語音技術應用于電子設備,實現喚醒電子設備的功能,即語音喚醒技術。通常語音喚醒(KWS Key WordSpotting)是通過設定一個固定的喚醒詞,在用戶說出喚醒詞之后,終端上的語音識別功能,才會處于工作狀態,否則處于休眠狀態。
發明內容
有鑒于此,本發明實施例提供一種電子設備喚醒方法、裝置、電子設備及存儲介質,能夠實現在滿足用戶對喚醒詞自定義的需求時,有效地降低計算復雜度提升響應速度,提升電子設備的喚醒性能,擴大了喚醒方案的適用場景,提升聲音處理模型的魯棒性和泛化能力。
本發明實施例的技術方案是這樣實現的:
本發明實施例提供了一種電子設備喚醒方法,所述方法包括:
獲取測試語音集合,并通過聲音處理模型中的第一神經網絡提取對應的測試語音特征集合;
通過所述聲音處理模型中的第一神經網絡,基于所述測試語音特征集合,確定相應的測試特征;
獲取喚醒語音特征集合,并通過聲音處理模型中的第一神經網絡提取對應的喚醒詞特征;
根據所述測試特征和所述喚醒詞特征,通過所述聲音處理模型中的第二神經網絡進行喚醒判決,以實現基于所述喚醒判決的結果,通過電子設備執行與所述喚醒語音特征相匹配的任務。
本發明實施例還提供了一種電子設備喚醒裝置,包括:
信息傳輸模塊,用于獲取測試語音集合;
信息處理模塊,用于通過聲音處理模型中的第一神經網絡提取對應的測試語音特征集合;
所述信息處理模塊,用于通過所述聲音處理模型中的第一神經網絡,基于所述測試語音特征集合,確定相應的測試特征;
所述信息處理模塊,用于獲取喚醒語音特征集合,并通過聲音處理模型中的第一神經網絡提取對應的喚醒詞特征;
所述信息處理模塊,用于根據所述測試特征和所述喚醒詞特征,通過所述聲音處理模型中的第二神經網絡進行喚醒判決,以實現基于所述喚醒判決的結果,通過電子設備執行與所述喚醒語音特征相匹配的任務。
上述方案中,
所述信息處理模塊,用于將所述測試語音特征集合輸入所述第一神經網絡的聲學模型網絡;
所述信息處理模塊,用于當所述第一神經網絡的關鍵詞隱馬爾科夫網絡確定對應的置信度大于置信度閾值時,確定所述聲學模型網絡的隱藏輸出層的輸出特征為相應的測試特征。
上述方案中,
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于騰訊科技(深圳)有限公司,未經騰訊科技(深圳)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010564571.3/2.html,轉載請聲明來源鉆瓜專利網。





