[發明專利]確定訓練樣本的方法及裝置、訓練深度學習模型的方法有效
| 申請號: | 202010904622.2 | 申請日: | 2020-09-01 |
| 公開(公告)號: | CN112036491A | 公開(公告)日: | 2020-12-04 |
| 發明(設計)人: | 張榮國;李新陽;王少康;陳寬 | 申請(專利權)人: | 北京推想科技有限公司 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62;G06K9/46;G06K9/34;G06N20/00 |
| 代理公司: | 北京布瑞知識產權代理有限公司 11505 | 代理人: | 秦衛中 |
| 地址: | 100085 北京市海淀*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 確定 訓練 樣本 方法 裝置 深度 學習 模型 | ||
1.一種確定訓練樣本的方法,其特征在于,包括:
獲取第一待標注樣本集中的N個待標注樣本的特征向量,其中,N為正整數;
根據所述N個待標注樣本的特征向量之間的差異性,從所述N個待標注樣本中確定M個待標注樣本,以對所述M個待標注樣本進行標注,獲得標注樣本集,其中M為正整數,并且M小于N。
2.根據權利要求1所述的方法,其特征在于,所述標注樣本集包括第一標注樣本集,所述根據所述N個待標注樣本的特征向量之間的差異性,從所述N個待標注樣本中確定M個待標注樣本,以對所述M個待標注樣本進行標注,獲得標注樣本集,包括:
將所述第一待標注樣本集中的第一樣本分別與其余每個待標注樣本進行特征相似度計算,獲得第一相似度結果,其中,所述第一樣本為所述第一待標注樣本集中的任意一個待標注樣本;
根據所述第一相似度結果,從所述第一待標注樣本集中確定與所述第一樣本存在最大差異的至少一個第一訓練樣本,以對所述至少一個第一訓練樣本進行標注,獲得第一標注樣本集。
3.根據權利要求2所述的方法,其特征在于,所述標注樣本集包括所述第一標注樣本集和第二標注樣本集,所述根據所述N個待標注樣本的特征向量之間的差異性,從所述N個待標注樣本中確定M個待標注樣本,以對所述M個待標注樣本進行標注,獲得標注樣本集,還包括:
根據所述至少一個第一訓練樣本,得到第二待標注樣本集,其中所述第二待標注樣本集包括所述第一待標注樣本集中除所述至少一個第一訓練樣本之外的待標注樣本;
根據所述特征向量,分別將所述第二待標注樣本集中的每個待標注樣本與所述第一標注樣本集中的每個標注樣本進行特征相似度計算,獲得第二相似度結果;
根據所述第二相似度結果,從所述第二待標注樣本集中確定與所述第一標注樣本集存在最大差異的至少一個第二訓練樣本,以對所述至少一個第二訓練樣本進行標注,獲得所述第二標注樣本集。
4.根據權利要求3所述的方法,其特征在于,所述特征相似度計算包括特征距離計算,所述分別將所述第二待標注樣本集中的每個待標注樣本與所述第一標注樣本集中的每個標注樣本進行特征相似度計算,獲得第二相似度結果,包括:
分別計算所述第二待標注樣本集中的每個待標注樣本與所述第一標注樣本集中的每個標注樣本的特征距離之和,獲得所述第二相似度結果。
5.根據權利要求1所述的方法,其特征在于,還包括:
根據所述M個訓練樣本中的每個訓練樣本的標識符,對所述M個訓練樣本進行去重處理,
其中,上述對所述M個待標注樣本進行標注,獲得標注樣本集,包括:
對去重后的訓練樣本進行標注,獲得所述標注樣本集。
6.根據權利要求5所述的方法,其特征在于,所述標注樣本集用于對醫學圖像分割模型進行訓練,所述訓練樣本為醫學圖像,所述醫學圖像的標識符是通過哈希算法對所述醫學圖像對應的醫療數據記錄計算得到。
7.根據權利要求1至6中任一項所述的方法,其特征在于,所述獲取第一待標注樣本集中的N個待標注樣本的特征向量,包括:
獲取所述N個待標注樣本中的每個待標注樣本中的待標注目標區域;
對所述待標注目標區域進行特征提取,獲得所述特征向量。
8.一種訓練深度學習模型的方法,其特征在于,包括:
根據權利要求1至7中的任一項所述的確定訓練樣本的方法確定待標注樣本,以對所述待標注樣本進行標注,獲得標注樣本集;
利用所述標注樣本集訓練深度學習模型。
9.一種確定訓練樣本的裝置,其特征在于,包括:
獲取模塊,用于獲取第一待標注樣本集中的N個待標注樣本的特征向量,其中,N為正整數;
確定模塊,用于根據所述N個待標注樣本的特征向量之間的差異性,從所述N個待標注樣本中確定M個待標注樣本,以對所述M個待標注樣本進行標注,獲得標注樣本集,其中M為正整數,并且M小于N。
10.一種計算機可讀存儲介質,其特征在于,所述存儲介質存儲有計算機程序,所述計算機程序用于執行上述權利要求1至8任一所述的方法。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京推想科技有限公司,未經北京推想科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010904622.2/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:相機增益的調整方法和裝置、掃描系統
- 下一篇:井間定位信號頻率估計方法





