[發明專利]一種用于手勢姿態分類的方法在審
| 申請號: | 202010510643.6 | 申請日: | 2020-06-08 |
| 公開(公告)號: | CN111695484A | 公開(公告)日: | 2020-09-22 |
| 發明(設計)人: | 陳海波 | 申請(專利權)人: | 深蘭人工智能芯片研究院(江蘇)有限公司 |
| 主分類號: | G06K9/00 | 分類號: | G06K9/00;G06K9/62;G06K9/46 |
| 代理公司: | 常州佰業騰飛專利代理事務所(普通合伙) 32231 | 代理人: | 滕詣迪 |
| 地址: | 213000 江蘇省常州市武進*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 用于 手勢 姿態 分類 方法 | ||
1.一種用于手勢姿態分類的方法,其特征在于包括如下步驟:
熱圖融合步驟,首先生成每個關節點的熱圖,將生成的熱圖上取最大值進行融合;
強化結構信息步驟,將在已有的關節點中插入新的關節點,在每根手指可見的相鄰兩個關節點之間做插值,映射到熱圖,同樣將插入的每個關節點轉為熱圖,最終將關節點和插入點的熱圖做融合,生成聯合熱圖;
聯合熱圖回歸步驟,對于聯合熱圖的回歸損失采用了L2損失函數進行回歸;
關節點的分類步驟,基于聯合熱圖進行像素級分類,使用focal loss損失函數求解。
2.根據權利要求1所述的用于手勢姿態分類的方法,其特征在于,熱圖融合步驟:
首先生成每個關節點的熱圖,Jk(k∈(1,2,...,K))表示一只手的k個關節點,將每個可見關節點轉為k∈{Ivisual},其中Ivisual表示所有可見關節點索引的集合,分別表示標注數據關節點在熱圖上對應的坐標,jkx、jky、jkz分別表示標注數據關節點的相機坐標,R為熱圖的縮放因子;然后將生成的len(Ivisual)個熱圖進行融合,融合的策略為在熱圖像素上取最大值,融合的熱圖:
3.根據權利要求1所述的用于手勢姿態分類的方法,其特征在于,強化結構信息步驟:
在每根手指可見的相鄰兩個關節點之間做插值,假定手部手指關節點之間的骨骼為直線,即插入的關節點由指頭的相鄰兩個關節點生成,插入關節點的坐標計算為:
xin=m(x2-x1)+x1,yin=m(y2-y1)+y1,zin=m(z2-z1)+z1,m∈(0,1),Jin={(xin,yin,zin)},
其中(x1,y1,z1)和(x2,y2,z2)為手指上相鄰的兩個關節點坐標,Jin表示所有插入關節點的集合,映射到熱圖為,同樣將插入的每個關節點轉為熱圖:
其中表示插入的所有關節點,最終將關節點和插入點的熱圖做融合。
4.根據權利要求3所述的用于手勢姿態分類的方法,其特征在于:每個插入點的熱圖值分布范圍要比關節點的小,最終的聯合熱圖可表示為:
5.根據權利要求1所述的用于手勢姿態分類的方法,其特征在于,聯合熱圖回歸步驟:
采用了L2損失函數,其中為預測的聯合熱圖,而hunion為真實聯合熱圖;
6.根據權利要求1所述的用于手勢姿態分類的方法,其特征在于,關節點的分類步驟:
基于聯合熱圖進行像素級分類,其中0類代表非關節點,1~k類表示k個關節點類別;這樣在熱圖之后會有w*h*(k+1)的特征圖,其中w為熱圖的寬度,h為熱圖的高度,k+1為特征圖的通道數;然后使用focal loss損失函數,其中y為熱圖每個像素的真實類別,1~k類中的某類,y′為預測為第k個類別的概率,α為正負樣本平衡系數,γ為單樣本權重降低的速率:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于深蘭人工智能芯片研究院(江蘇)有限公司,未經深蘭人工智能芯片研究院(江蘇)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010510643.6/1.html,轉載請聲明來源鉆瓜專利網。





