[發明專利]難樣本采樣方法和系統有效
| 申請號: | 201910169388.0 | 申請日: | 2019-03-06 |
| 公開(公告)號: | CN109978017B | 公開(公告)日: | 2021-06-01 |
| 發明(設計)人: | 祁亞斐;劉鵬;左思 | 申請(專利權)人: | 開易(北京)科技有限公司 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62;G06N3/04;G06N3/08 |
| 代理公司: | 北京知果之信知識產權代理有限公司 11541 | 代理人: | 唐海力;李志剛 |
| 地址: | 100102 北京市*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 樣本 采樣 方法 系統 | ||
本發明實施例公開一種難樣本采樣方法和系統,其中方法包括如下步驟:通過采用深度學習模型獲取所輸入的訓練圖像數據對應的特征圖,再基于第一超參數確定特征圖中的難樣本數,然后根據第二超參數和特征圖中的樣本計算特征圖中的預設難樣本數。采用本發明,通過引入兩個超參數分析特征圖中的難樣本,可以提高難樣本挖掘的速度,再基于HES模型對特征圖進行處理,更新目標檢測模型的參數,可以保證最終的檢測精度和時效性。
技術領域
本發明涉及樣本挖掘技術領域,尤其涉及一種難樣本采樣方法和系統。
背景技術
在機器學習模型訓練過程中,模型識別能力比較弱的樣本設定為難樣本。對難樣本的挖掘學習可以明顯提高目標檢測方法的檢測精度。然而,基于預選框篩選的兩階段方法速度過慢,同時基于直接回歸的一階段方法上則沒有較有效的難樣本挖掘方法。
發明內容
本發明實施例提供一種難樣本采樣方法和系統,通過引入兩個超參數分析特征圖中的難樣本,可以提高難樣本挖掘的速度,再基于HES模型對特征圖進行處理,更新目標檢測模型的參數,可以保證最終的檢測精度和時效性。
本發明實施例第一方面提供了一種難樣本采樣方法,可包括:
采用深度學習模型獲取所輸入的訓練圖像數據對應的特征圖;
基于第一超參數確定所述特征圖中的難樣本數;
根據第二超參數和所述特征圖中的樣本計算所述特征圖中的預設難樣本數。
在一種可能的設計中,在基于第一超參數確定所述特征圖中的難樣本數時,上述采樣方法還包括:
根據所述特征圖中各元素的預測信息將所述各元素劃分至不同的樣本中;
計算各樣本的樣本損失;
根據各樣本的樣本損失的大小對所述各樣本進行排序,組成樣本損失序列;
基于所述第一超參數在所述樣本損失序列中確定所述特征圖中的難樣本數。
在一種可能的設計中,在基于所述第一超參數在所述樣本損失序列中確定所述特征圖中的難樣本時,上述采樣方法還包括:
遍歷所述樣本損失序列,確定樣本損失最大的樣本作為目標難樣本;
采用HES模型將所述樣本損失序列中的非難樣本剔除,得到所述特征圖中的難樣本數;
其中,所述非難樣本的樣本損失小于所述目標難樣本的樣本損失,所述非難樣本的IoU大于第一超參數。
在一種可能的設計中,上述采樣方法還包括:
采用和所述特征圖同樣維度的矩陣M點積乘所述特征圖,得到所述特征圖對應的更新特征圖;
對所述更新特征圖進行損失反向傳播,更新所述深度學習模型中的模型參數。
在一種可能的設計中:
所述M矩陣中的初始元素均為0。
在一種可能的設計中,上述采樣方法還包括:
將所述特征圖中確定為難樣本的樣本點對應的位置確定為目標位置;
將所述M矩陣中和所述目標位置相對應的位置處的元素置為1。
本發明實施例第二方面提供了一種難樣本采樣系統,可包括:
特征圖獲取模塊,用于采用深度學習模型獲取所輸入的訓練圖像數據對應的特征圖;
難樣本確定模塊,用于基于第一超參數確定所述特征圖中的難樣本數;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于開易(北京)科技有限公司,未經開易(北京)科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910169388.0/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種網絡用戶身份識別方法
- 下一篇:一種中藥材人工智能鑒別系統及其鑒別方法





