[發(fā)明專利]一種語音控制的方法及裝置有效

申請?zhí)枺?/td>	201811031798.0	申請日：	2018-09-05
公開（公告）號：	CN109032039B	公開（公告）日：	2021-05-11
發(fā)明（設(shè)計）人：	許超	申請（專利權(quán)）人：	出門問問創(chuàng)新科技有限公司
主分類號：	G05B19/042	分類號：	G05B19/042;G10L15/22;G10L15/26
代理公司：	北京睿派知識產(chǎn)權(quán)代理事務(wù)所(普通合伙) 11597	代理人：	劉鋒
地址：	210038 江蘇省南京市***	國省代碼：	江蘇;32
權(quán)利要求書：	查看更多	說明書：	查看更多
摘要：
搜索關(guān)鍵詞：	一種語音控制方法裝置
鉆瓜網(wǎng) 技術(shù)展會專利詞庫專利權(quán)人專利榜在售專利公布日期熱門專利

【說明書】：

本發(fā)明實(shí)施例公開了一種語音控制的方法及裝置，以避免多個設(shè)備同時對用戶的語音指令進(jìn)行響應(yīng)而造成的誤操作。該方法包括：獲得用戶姿態(tài)圖像，所述用戶姿態(tài)圖像是由位于預(yù)設(shè)空間中的至少一個采集設(shè)備在第一時刻采集的；根據(jù)用戶姿態(tài)圖像，從所述預(yù)設(shè)空間中的至少一個被控設(shè)備中確定用戶意圖控制的目標(biāo)被控設(shè)備；控制所述目標(biāo)被控設(shè)備響應(yīng)所述用戶在所述第一時刻輸入的語音指令。

技術(shù)領(lǐng)域

本發(fā)明涉及終端應(yīng)用領(lǐng)域，特別是涉及一種語音控制的方法及裝置。

背景技術(shù)

傳統(tǒng)的對多個設(shè)備的控制方法，通常是分別使用設(shè)備各自的遙控器進(jìn)行控制，而這些遙控器往往是互不通用的，且操作過于繁瑣。為了實(shí)現(xiàn)使用更簡單、更自然的操作方式來控制設(shè)備，語音控制應(yīng)運(yùn)而生。

目前，為了實(shí)現(xiàn)語音控制方式，被控設(shè)備要安裝有攝像頭或者語音設(shè)備，以實(shí)現(xiàn)視覺識別或語音識別。而在實(shí)際應(yīng)用環(huán)境中，同一空間內(nèi)可能有多個支持語音控制方式的設(shè)備，且這些設(shè)備都具備攝像頭以及語音軟件，這樣就容易在語音控制過程中造成誤操作。

發(fā)明內(nèi)容

有鑒于此，本發(fā)明實(shí)施例提供一種語音控制的方法及裝置，主要目的在于避免多個設(shè)備同時對用戶的語音指令進(jìn)行響應(yīng)而造成的誤操作。

依據(jù)本發(fā)明實(shí)施例的第一方面，提供了一種語音控制的方法，包括：獲得用戶姿態(tài)圖像，所述用戶姿態(tài)圖像是由位于預(yù)設(shè)空間中的至少一個采集設(shè)備在第一時刻采集的；根據(jù)用戶姿態(tài)圖像，從所述預(yù)設(shè)空間中的至少一個被控設(shè)備中確定用戶意圖控制的目標(biāo)被控設(shè)備；控制所述目標(biāo)被控設(shè)備響應(yīng)所述用戶在所述第一時刻輸入的語音指令。

在本發(fā)明實(shí)施例中，所述根據(jù)用戶姿態(tài)圖像，從所述預(yù)設(shè)空間中的至少一個被控設(shè)備中確定用戶意圖控制的目標(biāo)被控設(shè)備，包括：根據(jù)所述用戶姿態(tài)圖像，確定用戶的身體角度、用戶的面部角度和/或用戶的視線角度；根據(jù)所述用戶的身體角度、用戶的面部角度和/或用戶的視線角度，將所述至少一個被控設(shè)備中用戶面向的目標(biāo)被控設(shè)備確定為所述目標(biāo)被控設(shè)備。

在本發(fā)明實(shí)施例中，所述獲得用戶姿態(tài)圖像，包括：接收來自所述至少一個采集設(shè)備的至少一個圖像；從所述至少一個圖像中確定出時間戳為所述第一時刻的圖像；根據(jù)預(yù)設(shè)的目標(biāo)用戶模型，對時間戳為所述第一時刻的圖像進(jìn)行目標(biāo)檢測，確定出包含目標(biāo)用戶的圖像，所述目標(biāo)用戶為所述至少一個被控設(shè)備的使用者；將確定出的包含目標(biāo)用戶的圖像確定為所述用戶姿態(tài)圖像。

在本發(fā)明實(shí)施例中，所述控制所述目標(biāo)被控設(shè)備響應(yīng)所述用戶在所述第一時刻輸入的語音指令，包括：向所述目標(biāo)被控設(shè)備發(fā)送控制指令，所述控制指令用于指示所述目標(biāo)被控設(shè)備響應(yīng)所述用戶在所述第一時刻輸入的語音指令。

在本發(fā)明實(shí)施例中，所述獲得用戶姿態(tài)圖像，包括：獲得用戶在所述第一時刻輸入的語音指令；根據(jù)預(yù)設(shè)的用戶聲紋模型，對輸入所述語音指令的用戶進(jìn)行識別；當(dāng)識別出所述用戶為合法用戶時，采集所述用戶姿態(tài)圖像。

在本發(fā)明實(shí)施例中，所述控制所述目標(biāo)被控設(shè)備響應(yīng)所述用戶在所述第一時刻輸入的語音指令，包括：對所述語音指令進(jìn)行語音識別；響應(yīng)所述語音指令，執(zhí)行相應(yīng)的目標(biāo)操作。

依據(jù)本發(fā)明實(shí)施例的第二方面，提供了一種語音控制的裝置，包括：獲得單元，用于獲得用戶姿態(tài)圖像，所述用戶姿態(tài)圖像是由位于預(yù)設(shè)空間中的至少一個采集設(shè)備在第一時刻采集的；確定單元，用于根據(jù)用戶姿態(tài)圖像，從所述預(yù)設(shè)空間中的至少一個被控設(shè)備中確定用戶意圖控制的目標(biāo)被控設(shè)備；控制單元，用于控制所述目標(biāo)被控設(shè)備響應(yīng)所述用戶在所述第一時刻輸入的語音指令。

在本發(fā)明實(shí)施例中，所述確定單元，具體用于根據(jù)所述用戶姿態(tài)圖像，確定用戶的身體角度、用戶的面部角度和/或用戶的視線角度；根據(jù)所述用戶的身體角度、用戶的面部角度和/或用戶的視線角度，將所述至少一個被控設(shè)備中用戶面向的目標(biāo)被控設(shè)備確定為所述目標(biāo)被控設(shè)備。

下載完整專利技術(shù)內(nèi)容需要扣除積分，VIP會員可以免費(fèi)下載。

免登錄下載普通用戶下載升級VIP會員，免費(fèi)下載

該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息，商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于出門問問創(chuàng)新科技有限公司，未經(jīng)出門問問創(chuàng)新科技有限公司許可，擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作，請聯(lián)系【客服】

本文鏈接：http://www.szxzyx.cn/pat/books/201811031798.0/2.html，轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。

上一篇：一種基于強(qiáng)化學(xué)習(xí)的污水處理控制系統(tǒng)
下一篇：一種供氧機(jī)自動切換裝置

同類專利

專利分類

G 物理

G05 控制；調(diào)節(jié)
G05B 一般的控制或調(diào)節(jié)系統(tǒng)；這種系統(tǒng)的功能單元；用于這種系統(tǒng)或單元的監(jiān)視或測試裝置
G05B19-00 程序控制系統(tǒng)
G05B19-02 .電的
G05B19-43 .流體的
G05B19-44 ..氣動的
G05B19-46 ..液壓的
G05B19-04 ..除數(shù)字控制外的程序控制，即順序控制器或邏輯控制器

免登錄下載普通用戶下載升級VIP會員，免費(fèi)下載

專利文獻(xiàn)下載

說明：

1、專利原文基于中國國家知識產(chǎn)權(quán)局專利說明書；

2、支持發(fā)明專利、實(shí)用新型專利、外觀設(shè)計專利（升級中）；

3、專利數(shù)據(jù)每周兩次同步更新，支持Adobe PDF格式；

4、內(nèi)容包括專利技術(shù)的結(jié)構(gòu)示意圖、流程工藝圖或技術(shù)構(gòu)造圖；

5、已全新升級為極速版,下載速度顯著提升！歡迎使用！

請您登陸后，進(jìn)行下載，點(diǎn)擊【登陸】【注冊】