[發明專利]一種語音喚醒方法及電子設備有效

申請號：	202010063473.1	申請日：	2020-01-20
公開（公告）號：	CN111276142B	公開（公告）日：	2023-04-07
發明（設計）人：	靳源;馮大航;常樂	申請（專利權）人：	北京聲智科技有限公司
主分類號：	G10L15/22	分類號：	G10L15/22;G10L15/24
代理公司：	北京銀龍知識產權代理有限公司 11243	代理人：	許靜;黃燦
地址：	100098 北京市***	國省代碼：	北京;11
權利要求書：	查看更多	說明書：	查看更多
摘要：
搜索關鍵詞：	一種語音喚醒方法電子設備
鉆瓜網技術展會專利詞庫專利權人專利榜在售專利公布日期熱門專利

【說明書】：

本發明提供一種語音喚醒方法及電子設備，該方法包括：獲取攝像頭采集的第一圖像；在識別到所述第一圖像中包括人臉圖像的情況下，獲取所述人臉圖像對應的對象的位置信息；根據所述位置信息，調整所述電子設備的喚醒閾值；基于調整后的喚醒閾值，控制所述電子設備響應用戶的語音喚醒指令。本發明實施例能夠通過獲取用戶的位置信息，適應調整電子設備的喚醒閾值，可使語音喚醒方式較為靈活。

技術領域

本發明涉及語音處理技術領域，尤其涉及一種語音喚醒方法及電子設備。

背景技術

語音喚醒技術的應用領域較為廣泛，例如手機、可穿戴設備、智能音箱、智能家居、車載等。幾乎很多帶有語音功能的設備，都會需要語音喚醒技術作為人機互動的一個開始或入口，不同的產品會有不同的喚醒詞，用戶可通過特定的喚醒詞喚醒電子設備。

目前，在語音喚醒的過程中，為了避免誤喚醒，往往會對喚醒語音的匹配精度要求較高，即通常會將喚醒閾值固定設為的較高的喚醒閾值，可見，這種喚醒方式不夠靈活。

發明內容

本發明實施例提供一種語音喚醒方法及電子設備，以解決現有語音喚醒方式不夠靈活的問題。

為解決上述技術問題，本發明是這樣實現的：

第一方面，本發明實施例提供了一種語音喚醒方法，應用于包括攝像頭的電子設備，其特征在于，所述方法包括：

獲取所述攝像頭采集的第一圖像；

在識別到所述第一圖像中包括人臉圖像的情況下，獲取所述人臉圖像對應的對象的位置信息；

根據所述位置信息，調整所述電子設備的喚醒閾值；

基于調整后的喚醒閾值，控制所述電子設備響應用戶的語音喚醒指令。

可選的，所述獲取所述人臉圖像對應的對象的位置信息，包括：

獲取所述人臉圖像在所述第一圖像中的坐標位置信息；

所述根據所述位置信息，調整所述電子設備的喚醒閾值，包括：

基于所述坐標位置信息，獲取所述人臉圖像對應的對象相對于所述電子設備中心的偏移距離；

根據目標距離，調整所述電子設備的喚醒閾值，其中，所述目標距離為所述偏移距離。

可選的，所述獲取所述人臉圖像對應的對象的位置信息，包括：

獲取所述人臉圖像對應的對象相對于所述電子設備的直線距離；

所述根據所述位置信息，調整所述電子設備的喚醒閾值，包括：

根據目標距離，調整所述電子設備的喚醒閾值，其中，所述目標距離為所述直線距離。

可選的，所述根據目標距離，調整所述電子設備的喚醒閾值，包括：

在所述目標距離小于或等于第一距離閾值的情況下，調整所述電子設備的喚醒閾值為第一喚醒閾值，其中，所述目標距離為所述偏移距離或所述直線距離；

在所述目標距離大于所述第一距離閾值且小于或等于第二距離閾值的情況下，調整所述電子設備的喚醒閾值為第二喚醒閾值，其中，所述第二距離閾值大于所述第一距離閾值，所述第二喚醒閾值高于所述第一喚醒閾值；

在所述目標距離大于所述第二距離閾值的情況下，調整所述電子設備的喚醒閾值為第三喚醒閾值，其中，所述第三喚醒閾值高于所述第二喚醒閾值。

可選的，所述在識別到所述第一圖像中包括人臉圖像的情況下，獲取所述人臉圖像對應的對象的位置信息，包括：

識別所述第一圖像中的對象，確定所述第一圖像的類別，所述類別包括人物類或者非人物類；

下載完整專利技術內容需要扣除積分，VIP會員可以免費下載。

免登錄下載普通用戶下載升級VIP會員，免費下載

該專利技術資料僅供研究查看技術是否侵權等信息，商用須獲得專利權人授權。該專利全部權利屬于北京聲智科技有限公司，未經北京聲智科技有限公司許可，擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作，請聯系【客服】

本文鏈接：http://www.szxzyx.cn/pat/books/202010063473.1/2.html，轉載請聲明來源鉆瓜專利網。

上一篇：補光燈組件及電子設備
下一篇：區塊鏈層次化數據交換方法、裝置和計算機設備

同類專利

專利分類

G 物理

G10 樂器；聲學
G10L 語音分析或合成；語音識別；音頻分析或處理
G10L15-00 語音識別
G10L15-02 .語音識別的特征提??；識別單位的選擇
G10L15-04 .分段或字極限檢測
G10L15-06 .創建基準模板；訓練語音識別系統，例如對說話者聲音特征的適應
G10L15-08 .語音分類或檢索
G10L15-20 .專門適用于不利環境

免登錄下載普通用戶下載升級VIP會員，免費下載

專利文獻下載

說明：

1、專利原文基于中國國家知識產權局專利說明書；

2、支持發明專利、實用新型專利、外觀設計專利（升級中）；

3、專利數據每周兩次同步更新，支持Adobe PDF格式；

4、內容包括專利技術的結構示意圖、流程工藝圖或技術構造圖；

5、已全新升級為極速版,下載速度顯著提升！歡迎使用！

請您登陸后，進行下載，點擊【登陸】【注冊】