[發明專利]基于手勢的語音喚醒方法、裝置、設備及計算機可讀介質在審
| 申請號: | 201810061028.4 | 申請日: | 2018-01-22 |
| 公開(公告)號: | CN108181992A | 公開(公告)日: | 2018-06-19 |
| 發明(設計)人: | 高亮 | 申請(專利權)人: | 北京百度網訊科技有限公司 |
| 主分類號: | G06F3/01 | 分類號: | G06F3/01 |
| 代理公司: | 北京市鑄成律師事務所 11313 | 代理人: | 張臻賢;王珺 |
| 地址: | 100085 北京市*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 喚醒 手勢圖像 語音 預設 手勢 匹配 計算機可讀介質 圖像 語音交互功能 智能語音交互 語音設備 采集 智能 | ||
本發明提出一種基于手勢的語音喚醒方法,包括以下步驟:采集用戶的手勢圖像;判斷用戶的手勢圖像是否與預設圖像相匹配;當用戶的手勢圖像與預設圖像相匹配時,喚醒語音交互功能。本發明實施例可以在不需要說出明確喚醒詞的情況下喚起智能語音交互設備,使得語音喚醒更加智能,方便用戶與語音設備的交互。
技術領域
本發明涉及語音喚醒技術領域,尤其涉及一種基于手勢的語音喚醒方法及裝置、設備和計算機可讀介質。
背景技術
隨著語音識別的能力的增強,越來越多的智能設備也應用到了語音識別。目前的智能設備的語音交互基本使用的方式是基于語音喚醒詞的語音交互。在進行語音功能喚醒的具體操作方式一般為采用固定的喚醒詞,比如:小度小度,Alexa,等來喚醒語音交互設備。在由語音交互設備進行啟動識別,然后再和用戶進行語音交互。
然而,現有的語音喚醒的方式,每次在進行語音交互前都要說一遍喚醒詞。重復的說喚醒詞會給用戶造成不好的體驗。
發明內容
本發明實施例提供一種基于手勢的語音喚醒方法、裝置、設備及計算機可讀介質,以解決或緩解現有技術中的以上技術問題。
第一方面,本發明實施例提供了一種基于手勢的語音喚醒方法,包括以下步驟:
采集用戶的手勢圖像;
判斷用戶的手勢圖像是否與預設圖像相匹配;
當用戶的手勢圖像與預設圖像相匹配時,喚醒語音交互功能。
結合第一方面,本發明在第一方面的第一種實現方式中,所述預設圖像為:伸出手指的圖像。
結合第一方面,本發明在第一方面的第二種實現方式中,所述預設圖像為:打響指的手勢圖像。
結合第一方面,本發明在第一方面的第三種實現方式中,還包括:
采集用戶手勢發出的響聲;
判斷用戶的手勢響聲是否與預設響聲相匹配;以及
所述當用戶的手勢圖像與預設圖像相匹配時,喚醒語音交互功能的步驟包括:
當用戶的手勢圖像與預設圖像相匹配且手勢的響聲與預設響聲相匹配時,喚醒語音交互功能。
結合第一方面的第三種實現方式,本發明在第一方面的第四種實現方式中,所述預設手勢圖像為打響指的圖像,所述預設響聲為打響指的響聲。
第二方面,本發明實施例提供了一種基于手勢的語音喚醒裝置,包括:
圖像采集模塊,用于采集用戶的手勢圖像;
圖像判斷模塊,用于判斷用戶的手勢圖像是否與預設圖像相匹配;
喚醒模塊,用于當用戶的手勢圖像與預設圖像相匹配時,喚醒語音交互功能。
結合第二方面,本發明在第二方面第一種實現方式中,所述預設圖像為:伸出手指的圖像。
結合第二方面,本發明在第二方面第二種實現方式中,所述預設圖像為:打響指的手勢圖像。
結合第二方面,本發明在第二方面第三種實現方式中,還包括:
聲音采集模塊,用于采集用戶的手勢發出的響聲;
聲音判斷模塊,用于判斷用戶的手勢響聲是否與預設響聲相匹配;以及
所述喚醒模塊還用于當用戶的手勢圖像與預設圖像相匹配且手勢響聲與預設響聲相匹配時,喚醒語音交互功能。
結合第二方面的第三種實現方式,本發明在第二方面的第四種實現方式中,所述預設手勢圖像為打響指的圖像,所述預設響聲為打響指的響聲。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京百度網訊科技有限公司,未經北京百度網訊科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810061028.4/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:圖像顯示方法、裝置及電子設備
- 下一篇:用于增強現實設備的場景繪制方法





