[發明專利]基于手勢的語音喚醒方法、裝置、設備及計算機可讀介質在審

申請號：	201810061028.4	申請日：	2018-01-22
公開（公告）號：	CN108181992A	公開（公告）日：	2018-06-19
發明（設計）人：	高亮	申請（專利權）人：	北京百度網訊科技有限公司
主分類號：	G06F3/01	分類號：	G06F3/01
代理公司：	北京市鑄成律師事務所 11313	代理人：	張臻賢;王珺
地址：	100085 北京市***	國省代碼：	北京;11
權利要求書：	查看更多	說明書：	查看更多
摘要：
搜索關鍵詞：	喚醒手勢圖像語音預設手勢匹配計算機可讀介質圖像語音交互功能智能語音交互語音設備采集智能
鉆瓜網技術展會專利詞庫專利權人專利榜在售專利公布日期熱門專利

【說明書】：

本發明提出一種基于手勢的語音喚醒方法，包括以下步驟：采集用戶的手勢圖像；判斷用戶的手勢圖像是否與預設圖像相匹配；當用戶的手勢圖像與預設圖像相匹配時，喚醒語音交互功能。本發明實施例可以在不需要說出明確喚醒詞的情況下喚起智能語音交互設備，使得語音喚醒更加智能，方便用戶與語音設備的交互。

技術領域

本發明涉及語音喚醒技術領域，尤其涉及一種基于手勢的語音喚醒方法及裝置、設備和計算機可讀介質。

背景技術

隨著語音識別的能力的增強，越來越多的智能設備也應用到了語音識別。目前的智能設備的語音交互基本使用的方式是基于語音喚醒詞的語音交互。在進行語音功能喚醒的具體操作方式一般為采用固定的喚醒詞，比如：小度小度，Alexa，等來喚醒語音交互設備。在由語音交互設備進行啟動識別，然后再和用戶進行語音交互。

然而，現有的語音喚醒的方式，每次在進行語音交互前都要說一遍喚醒詞。重復的說喚醒詞會給用戶造成不好的體驗。

發明內容

本發明實施例提供一種基于手勢的語音喚醒方法、裝置、設備及計算機可讀介質，以解決或緩解現有技術中的以上技術問題。

第一方面，本發明實施例提供了一種基于手勢的語音喚醒方法，包括以下步驟：

采集用戶的手勢圖像；

判斷用戶的手勢圖像是否與預設圖像相匹配；

當用戶的手勢圖像與預設圖像相匹配時，喚醒語音交互功能。

結合第一方面，本發明在第一方面的第一種實現方式中，所述預設圖像為：伸出手指的圖像。

結合第一方面，本發明在第一方面的第二種實現方式中，所述預設圖像為：打響指的手勢圖像。

結合第一方面，本發明在第一方面的第三種實現方式中，還包括：

采集用戶手勢發出的響聲；

判斷用戶的手勢響聲是否與預設響聲相匹配；以及

所述當用戶的手勢圖像與預設圖像相匹配時，喚醒語音交互功能的步驟包括：

當用戶的手勢圖像與預設圖像相匹配且手勢的響聲與預設響聲相匹配時，喚醒語音交互功能。

結合第一方面的第三種實現方式，本發明在第一方面的第四種實現方式中，所述預設手勢圖像為打響指的圖像，所述預設響聲為打響指的響聲。

第二方面，本發明實施例提供了一種基于手勢的語音喚醒裝置，包括：

圖像采集模塊，用于采集用戶的手勢圖像；

圖像判斷模塊，用于判斷用戶的手勢圖像是否與預設圖像相匹配；

喚醒模塊，用于當用戶的手勢圖像與預設圖像相匹配時，喚醒語音交互功能。

結合第二方面，本發明在第二方面第一種實現方式中，所述預設圖像為：伸出手指的圖像。

結合第二方面，本發明在第二方面第二種實現方式中，所述預設圖像為：打響指的手勢圖像。

結合第二方面，本發明在第二方面第三種實現方式中，還包括：

聲音采集模塊，用于采集用戶的手勢發出的響聲；

聲音判斷模塊，用于判斷用戶的手勢響聲是否與預設響聲相匹配；以及

所述喚醒模塊還用于當用戶的手勢圖像與預設圖像相匹配且手勢響聲與預設響聲相匹配時，喚醒語音交互功能。

結合第二方面的第三種實現方式，本發明在第二方面的第四種實現方式中，所述預設手勢圖像為打響指的圖像，所述預設響聲為打響指的響聲。

下載完整專利技術內容需要扣除積分，VIP會員可以免費下載。

免登錄下載普通用戶下載升級VIP會員，免費下載

該專利技術資料僅供研究查看技術是否侵權等信息，商用須獲得專利權人授權。該專利全部權利屬于北京百度網訊科技有限公司，未經北京百度網訊科技有限公司許可，擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作，請聯系【客服】

本文鏈接：http://www.szxzyx.cn/pat/books/201810061028.4/2.html，轉載請聲明來源鉆瓜專利網。

同類專利

專利分類

G 物理

G06 計算；推算；計數
G06F 電數字數據處理
G06F3-00 用于將所要處理的數據轉變成為計算機能夠處理的形式的輸入裝置；用于將數據從處理機傳送到輸出設備的輸出裝置，例如，接口裝置
G06F3-01 .用于用戶和計算機之間交互的輸入裝置或輸入和輸出組合裝置
G06F3-05 .在規定的時間間隔上，利用模擬量取樣的數字輸入
G06F3-06 .來自記錄載體的數字輸入，或者到記錄載體上去的數字輸出
G06F3-09 .到打字機上去的數字輸出
G06F3-12 .到打印裝置上去的數字輸出

免登錄下載普通用戶下載升級VIP會員，免費下載

專利文獻下載

說明：

1、專利原文基于中國國家知識產權局專利說明書；

2、支持發明專利、實用新型專利、外觀設計專利（升級中）；

3、專利數據每周兩次同步更新，支持Adobe PDF格式；

4、內容包括專利技術的結構示意圖、流程工藝圖或技術構造圖；

5、已全新升級為極速版,下載速度顯著提升！歡迎使用！

請您登陸后，進行下載，點擊【登陸】【注冊】