[發(fā)明專利]一種語音控制的方法及裝置有效
| 申請?zhí)枺?/td> | 201811031798.0 | 申請日: | 2018-09-05 |
| 公開(公告)號: | CN109032039B | 公開(公告)日: | 2021-05-11 |
| 發(fā)明(設(shè)計)人: | 許超 | 申請(專利權(quán))人: | 出門問問創(chuàng)新科技有限公司 |
| 主分類號: | G05B19/042 | 分類號: | G05B19/042;G10L15/22;G10L15/26 |
| 代理公司: | 北京睿派知識產(chǎn)權(quán)代理事務(wù)所(普通合伙) 11597 | 代理人: | 劉鋒 |
| 地址: | 210038 江蘇省南京市*** | 國省代碼: | 江蘇;32 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 語音 控制 方法 裝置 | ||
本發(fā)明實(shí)施例公開了一種語音控制的方法及裝置,以避免多個設(shè)備同時對用戶的語音指令進(jìn)行響應(yīng)而造成的誤操作。該方法包括:獲得用戶姿態(tài)圖像,所述用戶姿態(tài)圖像是由位于預(yù)設(shè)空間中的至少一個采集設(shè)備在第一時刻采集的;根據(jù)用戶姿態(tài)圖像,從所述預(yù)設(shè)空間中的至少一個被控設(shè)備中確定用戶意圖控制的目標(biāo)被控設(shè)備;控制所述目標(biāo)被控設(shè)備響應(yīng)所述用戶在所述第一時刻輸入的語音指令。
技術(shù)領(lǐng)域
本發(fā)明涉及終端應(yīng)用領(lǐng)域,特別是涉及一種語音控制的方法及裝置。
背景技術(shù)
傳統(tǒng)的對多個設(shè)備的控制方法,通常是分別使用設(shè)備各自的遙控器進(jìn)行控制,而這些遙控器往往是互不通用的,且操作過于繁瑣。為了實(shí)現(xiàn)使用更簡單、更自然的操作方式來控制設(shè)備,語音控制應(yīng)運(yùn)而生。
目前,為了實(shí)現(xiàn)語音控制方式,被控設(shè)備要安裝有攝像頭或者語音設(shè)備,以實(shí)現(xiàn)視覺識別或語音識別。而在實(shí)際應(yīng)用環(huán)境中,同一空間內(nèi)可能有多個支持語音控制方式的設(shè)備,且這些設(shè)備都具備攝像頭以及語音軟件,這樣就容易在語音控制過程中造成誤操作。
發(fā)明內(nèi)容
有鑒于此,本發(fā)明實(shí)施例提供一種語音控制的方法及裝置,主要目的在于避免多個設(shè)備同時對用戶的語音指令進(jìn)行響應(yīng)而造成的誤操作。
依據(jù)本發(fā)明實(shí)施例的第一方面,提供了一種語音控制的方法,包括:獲得用戶姿態(tài)圖像,所述用戶姿態(tài)圖像是由位于預(yù)設(shè)空間中的至少一個采集設(shè)備在第一時刻采集的;根據(jù)用戶姿態(tài)圖像,從所述預(yù)設(shè)空間中的至少一個被控設(shè)備中確定用戶意圖控制的目標(biāo)被控設(shè)備;控制所述目標(biāo)被控設(shè)備響應(yīng)所述用戶在所述第一時刻輸入的語音指令。
在本發(fā)明實(shí)施例中,所述根據(jù)用戶姿態(tài)圖像,從所述預(yù)設(shè)空間中的至少一個被控設(shè)備中確定用戶意圖控制的目標(biāo)被控設(shè)備,包括:根據(jù)所述用戶姿態(tài)圖像,確定用戶的身體角度、用戶的面部角度和/或用戶的視線角度;根據(jù)所述用戶的身體角度、用戶的面部角度和/或用戶的視線角度,將所述至少一個被控設(shè)備中用戶面向的目標(biāo)被控設(shè)備確定為所述目標(biāo)被控設(shè)備。
在本發(fā)明實(shí)施例中,所述獲得用戶姿態(tài)圖像,包括:接收來自所述至少一個采集設(shè)備的至少一個圖像;從所述至少一個圖像中確定出時間戳為所述第一時刻的圖像;根據(jù)預(yù)設(shè)的目標(biāo)用戶模型,對時間戳為所述第一時刻的圖像進(jìn)行目標(biāo)檢測,確定出包含目標(biāo)用戶的圖像,所述目標(biāo)用戶為所述至少一個被控設(shè)備的使用者;將確定出的包含目標(biāo)用戶的圖像確定為所述用戶姿態(tài)圖像。
在本發(fā)明實(shí)施例中,所述控制所述目標(biāo)被控設(shè)備響應(yīng)所述用戶在所述第一時刻輸入的語音指令,包括:向所述目標(biāo)被控設(shè)備發(fā)送控制指令,所述控制指令用于指示所述目標(biāo)被控設(shè)備響應(yīng)所述用戶在所述第一時刻輸入的語音指令。
在本發(fā)明實(shí)施例中,所述獲得用戶姿態(tài)圖像,包括:獲得用戶在所述第一時刻輸入的語音指令;根據(jù)預(yù)設(shè)的用戶聲紋模型,對輸入所述語音指令的用戶進(jìn)行識別;當(dāng)識別出所述用戶為合法用戶時,采集所述用戶姿態(tài)圖像。
在本發(fā)明實(shí)施例中,所述控制所述目標(biāo)被控設(shè)備響應(yīng)所述用戶在所述第一時刻輸入的語音指令,包括:對所述語音指令進(jìn)行語音識別;響應(yīng)所述語音指令,執(zhí)行相應(yīng)的目標(biāo)操作。
依據(jù)本發(fā)明實(shí)施例的第二方面,提供了一種語音控制的裝置,包括:獲得單元,用于獲得用戶姿態(tài)圖像,所述用戶姿態(tài)圖像是由位于預(yù)設(shè)空間中的至少一個采集設(shè)備在第一時刻采集的;確定單元,用于根據(jù)用戶姿態(tài)圖像,從所述預(yù)設(shè)空間中的至少一個被控設(shè)備中確定用戶意圖控制的目標(biāo)被控設(shè)備;控制單元,用于控制所述目標(biāo)被控設(shè)備響應(yīng)所述用戶在所述第一時刻輸入的語音指令。
在本發(fā)明實(shí)施例中,所述確定單元,具體用于根據(jù)所述用戶姿態(tài)圖像,確定用戶的身體角度、用戶的面部角度和/或用戶的視線角度;根據(jù)所述用戶的身體角度、用戶的面部角度和/或用戶的視線角度,將所述至少一個被控設(shè)備中用戶面向的目標(biāo)被控設(shè)備確定為所述目標(biāo)被控設(shè)備。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于出門問問創(chuàng)新科技有限公司,未經(jīng)出門問問創(chuàng)新科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811031798.0/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





