[發明專利]人機交互方法、裝置、計算機設備和存儲介質有效
| 申請號: | 201810108122.0 | 申請日: | 2018-02-02 |
| 公開(公告)號: | CN108363557B | 公開(公告)日: | 2020-06-12 |
| 發明(設計)人: | 劉國華 | 申請(專利權)人: | 劉國華 |
| 主分類號: | G06F3/16 | 分類號: | G06F3/16;G06F16/332;G10L15/08;G10L15/20;G10L15/22 |
| 代理公司: | 廣州華進聯合專利商標代理有限公司 44224 | 代理人: | 易皎鶴 |
| 地址: | 518051 廣東省*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 人機交互 方法 裝置 計算機 設備 存儲 介質 | ||
本申請涉及一種人機交互方法、裝置、計算機設備和存儲介質,其中方法包括:檢測當前輸出音量,當輸出音量小于預設第一閾值時,啟動語音識別功能,采集用戶語音消息,同時檢測用戶語音音量的大小,響應用戶語音操作,當用戶語音音量大于預設第二閾值時,調小輸出音量,返回檢測當前輸出音量的步驟。整個過程中,通過設備本身輸出音量大小控制語音識別功能的開啟,以便準確響應用戶語音操作,并且在用戶語音大于一定時,減小輸出音量,以便凸顯以及準確采集用戶后續語音消息,給用戶操作來帶便捷,可以實現良好的人機交互。
技術領域
本申請涉及人機交互技術領域,特別是涉及一種人機交互方法、裝置、計算機設備和存儲介質。
背景技術
人機交互是指人與設備之間使用某種對話語言,以一定的交互方式,為完成確定任務的人與設備之間的信息交換過程。
隨著科學技術的發展,人機交互技術的應用領域越來越寬廣,小如收音機的播放按鍵,大至飛機上的儀表板、或是發電廠的控制室,用戶都可以通過人機交互界面與系統交流,并進行操作。目前在人機交互技術中,主流的人機交互方式主要包括3種,第一種是傳統按鍵方式;第二種是特定語音詞激活方式,如:在對話前先說“小冰你好”,設備才識別后面所聽到的語音;第三種是“舉手發言”,即先用一個特定手勢動作來讓設備啟動語音識別。
上述人機交互方式,雖然在一定程度上可以實現人機交互功能,但是由于交互方式單一,需要預先設定一定特定手勢動作,交互過程并不十分自然,在一定程度上給用戶操作帶來不便。
發明內容
基于此,有必要針對上述技術問題,提供一種能夠給用戶帶來便捷操作的人機交互方法、裝置、計算機設備和存儲介質。
一種人機交互方法,所述方法包括:
檢測當前輸出音量,當輸出音量小于預設第一閾值時,啟動語音識別功能;
當偵聽到用戶語音時,采集用戶語音消息;
檢測用戶語音音量,并響應用戶語音操作;
當用戶語音音量大于預設第二閾值時,減小輸出音量,返回所述檢測當前輸出音量的步驟。
在其中一個實施例中,所述檢測當前輸出音量之后還包括:
當所述輸出音量大于預設第一閾值時,關閉語音識別功能。
在其中一個實施例中,所述檢測當前輸出音量之后還包括:
當未檢測到用戶人臉時,關閉語音識別功能。
在其中一個實施例中,所述當所述輸出音量小于預設第一閾值時,啟動語音識別功能包括:
當所述輸出音量小于預設第一閾值且檢測到人臉時,啟動語音識別功能。
在其中一個實施例中,所述當所述輸出音量小于預設第一閾值且檢測到人臉時,啟動語音識別功能的步驟包括:
當所述輸出音量小于預設第一閾值時,啟動人臉頭部姿態檢測;
當檢測到正臉時,啟動語音識別功能。
在其中一個實施例中,所述當所述輸出音量小于預設第一閾值且檢測到人臉時,啟動語音識別功能的步驟包括:
當所述輸出音量小于預設第一閾值時,獲取用戶與設備處于相對正視狀態下的正視圖像數據;
實時采集用戶當前圖像數據,將當前采集的圖像數據與所述正視圖像數據比較;
當所述當前采集的圖像數據和所述正視圖像數據一致時,判定用戶與設備處于相對正視狀態,啟動語音識別功能。
在其中一個實施例中,所述響應用戶語音操作包括:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于劉國華,未經劉國華許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810108122.0/2.html,轉載請聲明來源鉆瓜專利網。





