[發明專利]一種訓練樣本集生成的方法、裝置、電子設備及存儲介質有效
| 申請號: | 202110953373.0 | 申請日: | 2021-08-19 |
| 公開(公告)號: | CN113642659B | 公開(公告)日: | 2023-06-20 |
| 發明(設計)人: | 鐘華平;劉卓名;何聰輝 | 申請(專利權)人: | 上海商湯科技開發有限公司 |
| 主分類號: | G06F18/214 | 分類號: | G06F18/214;G06F18/241;G06N3/0475;G06N3/084;G06N20/00 |
| 代理公司: | 北京中知恒瑞知識產權代理事務所(普通合伙) 11889 | 代理人: | 吳迪 |
| 地址: | 201306 上海市浦東新區中國(上*** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 訓練 樣本 生成 方法 裝置 電子設備 存儲 介質 | ||
本公開提供了一種訓練樣本集生成的方法、裝置、電子設備及存儲介質,其中,該方法包括:獲取各個未標注樣本、以及基于訓練樣本集訓練得到的目標神經網絡;基于各個未標注樣本、目標神經網絡,確定各個未標注樣本分別對目標神經網絡的網絡訓練的預估影響程度值;從各個未標注樣本中選取預估影響程度值符合預設要求的目標未標注樣本;在對選取的目標未標注樣本進行樣本標注得到目標已標注樣本的情況下,將目標已標注樣本添加至訓練樣本集中,得到更新后訓練樣本集;更新后訓練樣本集用于對目標神經網絡再次進行網絡訓練。本公開基于預估影響程度值實現了未標注樣本的自動選取,相比人工選取的方案,更為省時省力,也降低了后續的標注成本。
技術領域
本公開涉及機器學習技術領域,具體而言,涉及一種訓練樣本集生成的方法、裝置、電子設備及存儲介質。
背景技術
隨著深度學習的不斷發展,各種機器學習模型在各行各業取得了越來越大的成功,而這要歸功于大規模訓練數據集的支撐。訓練數據集是帶有豐富標注信息的數據集,收集并標注這樣的數據集通常需要龐大的人力和物力成本。
相關技術中可以采用人工方式進行訓練數據的篩選以構建更好的數據集,這導致人力物力成本過高。
發明內容
本公開實施例至少提供一種訓練樣本集生成的方法、裝置、電子設備及存儲介質,以自動實現訓練樣本的選取,省時省力。
第一方面,本公開實施例提供了一種訓練樣本集生成的方法,所述方法包括:
獲取各個未標注樣本、以及基于訓練樣本集訓練得到的目標神經網絡;
基于所述各個未標注樣本、所述目標神經網絡,確定所述各個未標注樣本分別對所述目標神經網絡的網絡訓練的預估影響程度值;
從所述各個未標注樣本中選取預估影響程度值符合預設要求的目標未標注樣本;
在對選取的所述目標未標注樣本進行樣本標注得到目標已標注樣本的情況下,將所述目標已標注樣本添加至所述訓練樣本集中,得到更新后訓練樣本集;所述更新后訓練樣本集用于對所述目標神經網絡再次進行網絡訓練。
采用上述訓練樣本集生成的方法,在獲取到各個未標注樣本以及目標神經網絡的情況下,可以先確定各個未標注樣本分別對目標神經網絡的網絡訓練的預估影響程度值,進而從各個未標注樣本中選取預估影響程度值符合預設要求的目標未標注樣本,這樣,在對目標未標注樣本進行樣本標注后即可以得到目標已標注樣本以進行訓練樣本集的更新。本公開基于預估影響程度值實現了未標注樣本的自動選取,相比人工選取的方案,更為省時省力,也降低了后續的標注成本。
在一種可能的實施方式中,所述訓練樣本集中包括各個第一已標注樣本;所述基于所述各個未標注樣本、所述目標神經網絡,確定所述各個未標注樣本分別對所述目標神經網絡的網絡訓練的預估影響程度值,包括:
基于所述各個第一已標注樣本以及所述目標神經網絡,確定在基于所述各個第一已標注樣本進行目標神經網絡前向傳播的過程中,所述各個第一已標注樣本對網絡訓練參數的預估影響程度和值;以及,
基于所述各個未標注樣本以及所述目標神經網絡,確定在基于所述各個未標注樣本進行目標神經網絡前向傳播的過程中,每個所述未標注樣本對網絡訓練參數的預估影響程度值;
基于所述各個第一已標注樣本對網絡訓練參數的預估影響程度和值以及每個所述未標注樣本對網絡訓練參數的預估影響程度值,確定每個所述未標注樣本對所述目標神經網絡的網絡訓練的預估影響程度值。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于上海商湯科技開發有限公司,未經上海商湯科技開發有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110953373.0/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種無點火藥數碼電子雷管
- 下一篇:多功能橡膠硫化助劑及其制備方法和應用





