[發明專利]圖像樣本數據增強訓練方法、裝置及電子設備在審

申請號：	202210288944.8	申請日：	2022-03-23
公開（公告）號：	CN114596637A	公開（公告）日：	2022-06-07
發明（設計）人：	盧子鵬;王健;孫昊;丁二銳	申請（專利權）人：	北京百度網訊科技有限公司
主分類號：	G06V40/20	分類號：	G06V40/20;G06V10/46;G06V10/774;G06K9/62;G06N20/00
代理公司：	北京博浩百睿知識產權代理有限責任公司 11134	代理人：	豐佩印
地址：	100085 北京市***	國省代碼：	北京;11
權利要求書：	查看更多	說明書：	查看更多
摘要：
搜索關鍵詞：	圖像樣本數據增強訓練方法裝置電子設備
鉆瓜網技術展會專利詞庫專利權人專利榜在售專利公布日期熱門專利

【說明書】：

本公開提供了一種圖像樣本數據增強訓練方法、裝置及電子設備，涉及人工智能領域，具體涉及計算機視覺、圖像識別和深度學習技術領域。具體實現方案為：獲取待訓練樣本，并采用待訓練樣本對預設的關鍵點模型進行訓練，并獲取訓練結果對應的第一損失值，從而根據第一損失值對預設隊列所包含的至少一個訓練樣本進行更新，得到目標隊列，其中，預設隊列中存儲有待訓練樣本中的至少部分訓練樣本，進而計算目標隊列所包含的至少一個訓練樣本的第二損失值，并根據第二損失值從目標隊列中確定至少一個候選訓練樣本，最后在任意一個或多個候選訓練樣本對應的第三損失值滿足預設條件時，確定該候選訓練樣本為目標訓練樣本。

技術領域

本公開涉及人工智能領域，尤其涉及計算機視覺、圖像識別和深度學習技術領域，具體而言，本公開提供了一種圖像樣本數據增強訓練方法、裝置及電子設備。

背景技術

隨著人工智能技術的發展，基于深度學習的人體姿態估計技術被越來越多地應用到人體動作分類等場景，同時隨著各種深度學習算法的改進和實現，對于人體關鍵點的估計精度也越來越高，但是在實際的人體姿態估計的過程中也會遇到一些困難樣本難以解決。例如，人體截斷、人體遮擋重疊等干擾場景，會大大減弱深度學習算法的性能。

在現有技術中，通過現有的方式獲取到的困難樣本數量較少，容易樣本和困難樣本的訓練不均衡，無法提升模型解決困難樣本的能力。

發明內容

本公開提供了一種圖像樣本數據增強訓練方法、裝置及電子設備。

根據本公開的一方面，提供了一種圖像樣本數據增強訓練方法，包括：獲取待訓練樣本，其中，待訓練樣本由多張圖像組成，多張圖像至少包含目標對象的姿態信息，并采用待訓練樣本對預設的關鍵點模型進行訓練，并獲取訓練結果對應的第一損失值，從而根據第一損失值對預設隊列所包含的至少一個訓練樣本進行更新，得到目標隊列，其中，預設隊列中存儲有待訓練樣本中的至少部分訓練樣本，進而計算目標隊列所包含的至少一個訓練樣本的第二損失值，并根據第二損失值從目標隊列中確定至少一個候選訓練樣本，最后在任意一個或多個候選訓練樣本對應的第三損失值滿足預設條件時，確定該候選訓練樣本為目標訓練樣本。

可選的，上述獲取待訓練樣本，包括：獲取預設設置的隨機數，并在隨機數小于隨機數閾值時，從訓練樣本庫中獲取待訓練樣本，從而在隨機數大于或等于隨機數閾值時，從目標隊列中獲取待訓練樣本。

可選的，上述采用待訓練樣本對預設的關鍵點模型進行訓練，并獲取訓練結果對應的第一損失值，包括：對待訓練樣本進行編輯操作，得到編輯后的待訓練樣本，并采用編輯后的待訓練樣本對預設的關鍵點模型進行訓練，得到訓練結果，從而基于預設的損失函數計算訓練結果對應的第一損失值。

可選的，上述根據第一損失值對預設隊列所包含的至少一個訓練樣本進行更新，得到目標隊列，包括：在第一損失值大于或等于第一閾值時，存儲待訓練樣本至預設隊列中，得到目標隊列。

可選的，圖像樣本數據增強訓練方法還包括：在存儲待訓練樣本至預設隊列中，得到目標隊列之后，確定目標隊列所包含的至少一個訓練樣本的第四損失值，并根據第四損失值的大小對目標隊列所包含的至少一個訓練樣本進行排序。

可選的，圖像樣本數據增強訓練方法還包括：在存儲待訓練樣本至預設隊列中，得到目標隊列之后，獲取目標隊列的隊列長度，并在隊列長度達到長度閾值時，停止向目標隊列中存儲待訓練樣本。

可選的，上述從目標隊列中獲取待訓練樣本，包括：獲取目標隊列所對應的隊列長度，并在隊列長度小于預設長度時，從目標隊列中隨機獲取待訓練樣本，從而在隊列長度大于或等于預設長度時，將目標隊列劃分為多個樣本塊，并根據多個樣本塊的樣本概率從目標隊列中確定目標樣本塊，得到待訓練樣本，其中，每個樣本塊包含至少一個子訓練樣本，樣本概率表征了多個樣本塊被選中的概率。

下載完整專利技術內容需要扣除積分，VIP會員可以免費下載。

免登錄下載普通用戶下載升級VIP會員，免費下載

該專利技術資料僅供研究查看技術是否侵權等信息，商用須獲得專利權人授權。該專利全部權利屬于北京百度網訊科技有限公司，未經北京百度網訊科技有限公司許可，擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作，請聯系【客服】

本文鏈接：http://www.szxzyx.cn/pat/books/202210288944.8/2.html，轉載請聲明來源鉆瓜專利網。