[發明專利]訓練方法、裝置、動作識別方法、裝置及電子設備有效
| 申請號: | 202110227119.2 | 申請日: | 2021-03-01 |
| 公開(公告)號: | CN112926462B | 公開(公告)日: | 2023-02-07 |
| 發明(設計)人: | 張發恩;秦樹鑫 | 申請(專利權)人: | 創新奇智(西安)科技有限公司 |
| 主分類號: | G06V40/10 | 分類號: | G06V40/10;G06V10/764;G06V10/44;G06V10/82;G06V10/766;G06N3/08 |
| 代理公司: | 北京超凡宏宇專利代理事務所(特殊普通合伙) 11463 | 代理人: | 張萌 |
| 地址: | 710000 陜西省西安市高新區魚化街辦*** | 國省代碼: | 陜西;61 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 訓練 方法 裝置 動作 識別 電子設備 | ||
本發明涉及一種訓練方法、裝置、動作識別方法、裝置及電子設備,在對待識別圖像進行動作識別時,先對待識別圖像進行第一次特征提取,得到特征圖,然后將特征圖輸入到用于檢測待識別圖像中的對象的輪廓特征的輪廓特征提取網絡,得到輪廓特征圖,然后對輪廓特征圖進行解碼,得到輪廓特征向量,并將輪廓特征向量通過分類模型進行分類,得到用于表征動作類別的分類結果。由于在上述過程中,采用的是對關鍵點遮擋不敏感的輪廓特征提取網絡,因此,即使是面對對象存在遮擋的待識別圖像,輪廓特征提取網絡也具有較強的抗干擾性,輸出的輪廓特征圖的可信度較高,進而有利于提高后續基于輪廓特征圖得到的輪廓特征向量進行動作識別時的識別準確度。
技術領域
本申請屬于圖像處理領域,具體涉及一種訓練方法、裝置、動作識別方法、裝置及電子設備。
背景技術
動作識別技術有著廣泛的應用場景,例如用于判斷人的行為屬性(比如判斷人的姿態是站立、坐姿、跌倒等),用于判斷動物或其他可變形物體(如機器人、機械臂等)的行為姿態等。
就目前而言,主要基于傳感器或基于視覺來實現動作識別。其中,相較于傳感器的方式,通過視覺來進行動作識別具有成本低、無需直接接觸(不需要安裝傳感器或實物標簽等)等優勢。
在實際應用中,當通過視覺來進行動作識別時,需要先訓練出一個神經網絡模型來輔助動作識別。在傳統的基于視覺的動作識別方案中,需要神經網絡模型檢測出識別對象的全部關鍵點。以識別人體的動作為例,需要神經網絡模型檢測出人體骨架的21關鍵點,在此基礎上,利用這些關鍵點坐標的位置信息,實現動作識別。然而,由于在應用檢測關鍵點的模型時,模型的輸入圖像可能存在相互遮擋的情況,導致最后得到的關鍵點位置的誤差較大,進而影響后續的動作識別準確度,也就是說,現有技術中的訓練方式所得到的用于輔助動作識別的模型的抗干擾性較弱,不利于提高后續基于其結果進行動作識別的準確性。
發明內容
有鑒于此,本申請的目的在于提供一種訓練方法、裝置、動作識別方法、裝置及電子設備,可以提高訓練得到的輪廓特征提取網絡的抗干擾性,進而提高后續通過該輪廓特征提取網絡進行動作識別時的準確度。
本申請的實施例是這樣實現的:
第一方面,本申請實施例提供一種訓練方法,用于訓練輪廓特征提取網絡,所述方法包括:獲取包括多個訓練樣本的訓練集,所述訓練樣本的訓練標簽包括:對象的中心點、所述對象的輪廓線、以所述中心點為起點且向所述輪廓線發散出N條射線后與所述輪廓線相交形成的N個輪廓關鍵點,相鄰兩條射線之間的角度差為A,且N=360/A;將所述訓練樣本輸入到基礎網絡模型進行訓練,直至所述基礎網絡模型收斂,得到所述輪廓特征提取網絡;其中,所述輪廓特征提取網絡的輸出為與其輸入特征圖中的對象對應的輪廓特征圖,所述輪廓特征圖包括:與所述輸入特征圖中的對象的N個輪廓關鍵點一一對應的N個關鍵點通道、與所述輸入特征圖中的對象的中心點對應的中心點通道,以及與所述N個關鍵點通道一一對應的,用于表征該關鍵點通道所指向的輪廓關鍵點與所述輸入特征圖中的對象的中心點之間的距離的距離回歸通道。
由于在上述訓練輪廓特征提取網絡的過程中,對于輪廓特征提取網絡的訓練樣本而言,并不需要標注訓練樣本中所有關鍵點的位置,從而降到了對訓練樣本的標注要求,相應的,相較于傳統訓練檢測全部關鍵點的神經網絡模型,還可以降低工作人員的標注工作量,以及降低訓練過程中的訓練成本,提高訓練速度。此外,由于輪廓特征提取網絡最終的輸出是對象的輪廓特征圖,且輪廓對于小部分遮擋并不是特別敏感,因此,對于輸入特征圖中的對象存在遮擋的情況,輪廓特征提取網絡具有較好的適應性,也就是說,輪廓特征提取網絡具有較強的抗干擾性,輸出的結果的可信度較高,進而有利于提高后續基于輪廓特征提取網絡的輸出結果進行動作識別時的識別準確度。
結合第一方面實施例,在一種可能的實施方式中,當在所述輸入特征圖中包括多個對象時,所述輪廓特征提取網絡的輸出為與每個對象對應的輪廓特征圖。也就是說,通過上述訓練方法訓練得到的輪廓特征提取網絡具備同時識別多個對象的輪廓特征圖的功能,可以提高識別效率。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于創新奇智(西安)科技有限公司,未經創新奇智(西安)科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110227119.2/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種菠蘿包制作方法
- 下一篇:一種模塊化的土體深部位移實時測量裝置





