[發明專利]電子設備喚醒方法、裝置、電子設備及存儲介質有效

申請號：	202010564571.3	申請日：	2020-06-19
公開（公告）號：	CN111739521B	公開（公告）日：	2021-06-22
發明（設計）人：	陳杰;蘇丹	申請（專利權）人：	騰訊科技（深圳）有限公司
主分類號：	G10L15/08	分類號：	G10L15/08;G10L15/06;G10L15/14;G10L15/18;G10L15/22;G10L25/03;G10L25/30
代理公司：	北京派特恩知識產權代理有限公司 11270	代理人：	崔曉嵐;張穎玲
地址：	518000 廣東省深圳***	國省代碼：	廣東;44
權利要求書：	查看更多	說明書：	查看更多
摘要：
搜索關鍵詞：	電子設備喚醒方法裝置存儲介質
鉆瓜網技術展會專利詞庫專利權人專利榜在售專利公布日期熱門專利

【說明書】：

本發明提供了一種電子設備喚醒方法，包括：獲取測試語音集合，并通過聲音處理模型中的第一神經網絡提取對應的測試語音特征集合；通過所述聲音處理模型中的第一神經網絡，基于所述測試語音特征集合，確定相應的測試特征；獲取喚醒語音特征集合，并通過聲音處理模型中的第一神經網絡提取對應的喚醒詞特征；根據所述測試特征和所述喚醒詞特征，通過所述聲音處理模型中的第二神經網絡進行喚醒判決，由此可以實現基于所述喚醒判決的結果，通過電子設備執行與喚醒語音特征相匹配的任務，有效地降低計算復雜度提升響應速度，提升電子設備的喚醒性能，擴大了喚醒方案的適用場景，提升聲音處理模型的魯棒性和泛化能力。

技術領域

本發明涉及語音識別技術，尤其涉及電子設備喚醒方法、裝置、電子設備及存儲介質。

背景技術

語音技術(Speech Technology)的關鍵技術有自動語音識別技術(ASRAutomaticSpeech Recognition)和文字語音轉換技術(TTS Test-to-speech)以及聲紋識別技術。讓計算機能聽、能看、能說、能感覺，是未來人機交互的發展方向，其中語音成為最為便捷的人機交互方式之一。將語音技術應用于電子設備，實現喚醒電子設備的功能，即語音喚醒技術。通常語音喚醒(KWS Key WordSpotting)是通過設定一個固定的喚醒詞，在用戶說出喚醒詞之后，終端上的語音識別功能，才會處于工作狀態，否則處于休眠狀態。

發明內容

有鑒于此，本發明實施例提供一種電子設備喚醒方法、裝置、電子設備及存儲介質，能夠實現在滿足用戶對喚醒詞自定義的需求時，有效地降低計算復雜度提升響應速度，提升電子設備的喚醒性能，擴大了喚醒方案的適用場景，提升聲音處理模型的魯棒性和泛化能力。

本發明實施例的技術方案是這樣實現的：

本發明實施例提供了一種電子設備喚醒方法，所述方法包括：

獲取測試語音集合，并通過聲音處理模型中的第一神經網絡提取對應的測試語音特征集合；

通過所述聲音處理模型中的第一神經網絡，基于所述測試語音特征集合，確定相應的測試特征；

獲取喚醒語音特征集合，并通過聲音處理模型中的第一神經網絡提取對應的喚醒詞特征；

根據所述測試特征和所述喚醒詞特征，通過所述聲音處理模型中的第二神經網絡進行喚醒判決，以實現基于所述喚醒判決的結果，通過電子設備執行與所述喚醒語音特征相匹配的任務。

本發明實施例還提供了一種電子設備喚醒裝置，包括：

信息傳輸模塊，用于獲取測試語音集合；

信息處理模塊，用于通過聲音處理模型中的第一神經網絡提取對應的測試語音特征集合；

所述信息處理模塊，用于通過所述聲音處理模型中的第一神經網絡，基于所述測試語音特征集合，確定相應的測試特征；