[發(fā)明專利]一種基于人工智能的人機(jī)交互方法有效
| 申請(qǐng)?zhí)枺?/td> | 202210376694.3 | 申請(qǐng)日: | 2022-04-12 |
| 公開(公告)號(hào): | CN114461078B | 公開(公告)日: | 2022-07-15 |
| 發(fā)明(設(shè)計(jì))人: | 王田;程嘉翔;丁好;呂金虎;張寶昌;劉克新 | 申請(qǐng)(專利權(quán))人: | 北京航空航天大學(xué) |
| 主分類號(hào): | G06F3/01 | 分類號(hào): | G06F3/01;G06V20/40;G06V40/16;G06V40/20 |
| 代理公司: | 北京康思博達(dá)知識(shí)產(chǎn)權(quán)代理事務(wù)所(普通合伙) 11426 | 代理人: | 范國鋒 |
| 地址: | 100191*** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 人工智能 人機(jī)交互 方法 | ||
1.一種基于人工智能的人機(jī)交互方法,其特征在于,包括以下步驟:
建立識(shí)別模型;
將視頻輸入識(shí)別模型,對(duì)視頻識(shí)別,獲得視頻中人物的動(dòng)態(tài)手勢(shì);
所述識(shí)別模型包括空間通道子模型和時(shí)間通道子模型,
空間通道子模型處理針對(duì)視頻幀的空間信息,時(shí)間通道子模型處理針對(duì)視頻片段時(shí)序信息、運(yùn)動(dòng)特征的信息;
在對(duì)視頻識(shí)別時(shí),從視頻中獲得幀圖片和光流估計(jì),將幀圖片輸入所述空間通道子模型中,獲得第一動(dòng)態(tài)手勢(shì)行為概率;
將光流估計(jì)輸入所述時(shí)間通道子模型中,獲得第二動(dòng)態(tài)手勢(shì)行為概率;
將第一動(dòng)態(tài)手勢(shì)行為概率和第二動(dòng)態(tài)手勢(shì)行為概率加權(quán)平均,獲得最終識(shí)別結(jié)果;
所述空間通道子模型為通過視頻幀圖片對(duì)I3D模型訓(xùn)練得到;所述時(shí)間通道子模型為通過視頻光流估計(jì)對(duì)I3D模型訓(xùn)練得到;
采用OpenCV對(duì)視頻片段逐幀抽取獲得視頻幀圖片,通過Farnback方法對(duì)視頻片段處理獲得光流估計(jì);
在對(duì)視頻識(shí)別時(shí),采用多線程技術(shù),將獲得幀圖片和光流估計(jì)作為第一獨(dú)立線程,將獲得第一動(dòng)態(tài)手勢(shì)行為概率、第二動(dòng)態(tài)手勢(shì)行為概率以及二者的加權(quán)平均作為第二獨(dú)立線程;
第一獨(dú)立線程由CPU執(zhí)行,在第一獨(dú)立線程執(zhí)行完畢后,檢測(cè)GPU是否空閑:若GPU空閑,由GPU執(zhí)行第二獨(dú)立線程,待第二獨(dú)立線程執(zhí)行完畢后,再次進(jìn)行第一獨(dú)立線程對(duì)后續(xù)視頻進(jìn)行識(shí)別;若GPU不處于空閑狀態(tài),則重復(fù)執(zhí)行第一線程,對(duì)后續(xù)視頻進(jìn)行幀圖片和光流估計(jì)的獲取;
在對(duì)視頻識(shí)別時(shí),還對(duì)會(huì)議主持人的人臉進(jìn)行識(shí)別,在獲取幀圖片和光流估計(jì)時(shí),僅保留主持人的相關(guān)信息,刪除其它人的相關(guān)信息。
2.根據(jù)權(quán)利要求1所述的基于人工智能的人機(jī)交互方法,其特征在于,
訓(xùn)練用視頻幀圖片和視頻光流估計(jì)為對(duì)視頻訓(xùn)練集處理獲得;
所述視頻訓(xùn)練集中包含多個(gè)具有會(huì)議手勢(shì)動(dòng)作的視頻片段。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于北京航空航天大學(xué),未經(jīng)北京航空航天大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202210376694.3/1.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06F 電數(shù)字?jǐn)?shù)據(jù)處理
G06F3-00 用于將所要處理的數(shù)據(jù)轉(zhuǎn)變成為計(jì)算機(jī)能夠處理的形式的輸入裝置;用于將數(shù)據(jù)從處理機(jī)傳送到輸出設(shè)備的輸出裝置,例如,接口裝置
G06F3-01 .用于用戶和計(jì)算機(jī)之間交互的輸入裝置或輸入和輸出組合裝置
G06F3-05 .在規(guī)定的時(shí)間間隔上,利用模擬量取樣的數(shù)字輸入
G06F3-06 .來自記錄載體的數(shù)字輸入,或者到記錄載體上去的數(shù)字輸出
G06F3-09 .到打字機(jī)上去的數(shù)字輸出
G06F3-12 .到打印裝置上去的數(shù)字輸出
- 使用基于云端的度量迭代訓(xùn)練人工智能的系統(tǒng)
- 一種人工智能轉(zhuǎn)人工智能再轉(zhuǎn)人工方案
- O-RAN系統(tǒng)中的人工智能模型處理方法和裝置
- 人工智能傷口評(píng)估方法及智能終端
- 人工智能倫理風(fēng)險(xiǎn)與防范虛擬仿真方法、系統(tǒng)和機(jī)器人
- 一種基于人工智能基礎(chǔ)資源與技術(shù)調(diào)控系統(tǒng)及方法
- 基于人工智能倫理備選規(guī)則的人工智能倫理風(fēng)險(xiǎn)防范方法
- 人工智能倫理風(fēng)險(xiǎn)辨識(shí)防范虛擬仿真實(shí)驗(yàn)方法和機(jī)器人
- 基于人工智能體決策的人工智能倫理風(fēng)險(xiǎn)辨識(shí)和防范方法
- 基于算法選擇的人工智能倫理風(fēng)險(xiǎn)辨識(shí)防范方法和機(jī)器人
- 基于Web服務(wù)的分布式人機(jī)交互系統(tǒng)
- 用于提供人機(jī)交互資源的方法及設(shè)備
- 基于配置化實(shí)現(xiàn)人機(jī)交互功能的方法
- 一種人機(jī)交互平臺(tái)位置可調(diào)節(jié)的儲(chǔ)物柜
- 車載人機(jī)交互方法、系統(tǒng)及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)
- 一種網(wǎng)格化的飛行管理系統(tǒng)人機(jī)交互設(shè)計(jì)與實(shí)現(xiàn)方法
- 人機(jī)交互優(yōu)化方法以及相關(guān)裝置
- 消毒型自助設(shè)備及其控制方法
- 一種實(shí)時(shí)3D遠(yuǎn)程人機(jī)交互裝置
- 一種人機(jī)交互設(shè)備控制方法及裝置
- 一種數(shù)據(jù)庫讀寫分離的方法和裝置
- 一種手機(jī)動(dòng)漫人物及背景創(chuàng)作方法
- 一種通訊綜合測(cè)試終端的測(cè)試方法
- 一種服裝用人體測(cè)量基準(zhǔn)點(diǎn)的獲取方法
- 系統(tǒng)升級(jí)方法及裝置
- 用于虛擬和接口方法調(diào)用的裝置和方法
- 線程狀態(tài)監(jiān)控方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)
- 一種JAVA智能卡及其虛擬機(jī)組件優(yōu)化方法
- 檢測(cè)程序中方法耗時(shí)的方法、裝置及存儲(chǔ)介質(zhì)
- 函數(shù)的執(zhí)行方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)





