[發明專利]一種數據標注方法、裝置及電子設備在審
| 申請號: | 201910284992.8 | 申請日: | 2019-04-10 |
| 公開(公告)號: | CN111814949A | 公開(公告)日: | 2020-10-23 |
| 發明(設計)人: | 周健;孫海鳴;謝迪;浦世亮 | 申請(專利權)人: | 杭州海康威視數字技術股份有限公司 |
| 主分類號: | G06N3/04 | 分類號: | G06N3/04;G06N3/08 |
| 代理公司: | 北京柏杉松知識產權代理事務所(普通合伙) 11413 | 代理人: | 李欣;馬敬 |
| 地址: | 310051 浙*** | 國省代碼: | 浙江;33 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 數據 標注 方法 裝置 電子設備 | ||
本發明實施例提供了一種數據標注方法、裝置及電子設備。其中,方法包括:基于新增訓練數據和歷史訓練數據,對預先經過訓練的訓練網絡進行增量式訓練;將待標注數據,和經過訓練后的所述訓練網絡的模型參數輸入至測試網絡,得到所述測試網路的輸出結果,作為預測值,所述測試網絡的網絡結構與所述訓練網絡的網絡結構相同;基于針對所述預測值的調整指令,對所述預測值進行調整,得到調整后的預測值,作為真值;將標注有所述真值的所述待標注數據作為新的新增訓練數據,并返回執行所述基于新增訓練數據和歷史訓練數據,對訓練網絡進行增量式訓練,得到經過訓練后的所述訓練網絡的模型參數的步驟。可以降低數據標注的人工成本。
技術領域
本發明涉及深度學習技術領域,特別是涉及一種數據標注方法、裝置及電子設備。
背景技術
為提高神經網絡的準確性,可以利用帶有標注的樣本數據對神經網絡進行訓練。在一些應用場景中,訓練可能需要大量帶有標注的樣本數據。如果使用人工標注的方式獲取帶有標注的樣本數據,需要花費較多的人工成本。
如果通過神經網絡直接標注樣本數據,標注數據的不準確性較高。如何提高神經網絡標注數據的準確性,成為亟待解決的技術問題。
發明內容
本發明實施例的目的在于提供一種數據標注方法,以實現降低數據標注的人工成本。具體技術方案如下:
在本發明實施例的第一方面,提供了一種數據標注方法,所述方法包括:
基于新增訓練數據和歷史訓練數據,對訓練網絡進行增量式訓練,所述歷史訓練數據為已用于訓練所述訓練網絡的已標注數據,所述新增訓練數據為尚未用于訓練所述訓練網絡的已標注數據;
將待標注數據,和經過訓練后的所述訓練網絡的模型參數輸入至測試網絡,得到所述測試網路的輸出結果,作為預測值,所述測試網絡的網絡結構與所述訓練網絡的網絡結構相同,所述待標注數據為與所述新增訓練數據和所述歷史訓練數據不同的數據;
基于針對所述預測值的調整指令,對所述預測值進行調整,得到調整后的預測值,作為真值;
將標注有所述真值的所述待標注數據作為新的新增訓練數據,并返回執行所述基于新增訓練數據和歷史訓練數據,對訓練網絡進行增量式訓練,得到經過訓練后的所述訓練網絡的模型參數的步驟。
結合第一方面,在第一種可能的實現方式中,在所述基于針對所述預測值的調整指令,對所述預測值進行調整,得到所述待標注數據的真值之后,所述方法還包括:
計算所述真值與所述預測值之間的差值,得到所述待標注數據對應的偏差;
所述基于新增訓練數據和歷史訓練數據,對訓練網絡進行增量式訓練,包括:
基于新增訓練數據、歷史訓練數據、以及新增訓練數據對應的偏差,對訓練網絡進行增量式訓練,其中,新增訓練數據對應的偏差,用于調整訓練所述訓練網絡時的收斂方向。
結合第一方面的第一種可能的實現方式,在第二種可能的實現方式中,所述計算所述真值與所述預測值之間的差值,得到待標注數據的偏差,包括:
計算所述真值與所述預測值之間的差值;
對所述差值進行歸一化,以將所述差值映射至所述待標注數據的取值區間,得到歸一化后的差值,作為待標注數據對應的偏差。
結合第一方面的第一種可能的實現方式,在第三種可能的實現方式中,所述訓練網絡預先通過以下方式訓練:
基于預先經過人工標注的樣本訓練數據以及所述樣本訓練數據對應的偏差,對訓練網絡進行訓練,其中,所述預先經過人工標注的樣本訓練數據對應的偏差為0。
結合第一方面,在第四種可能的實現方式中,在所述基于新增訓練數據和歷史訓練數據,對訓練網絡進行增量式訓練之后,所述方法還包括:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于杭州海康威視數字技術股份有限公司,未經杭州海康威視數字技術股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910284992.8/2.html,轉載請聲明來源鉆瓜專利網。
- 數據顯示系統、數據中繼設備、數據中繼方法、數據系統、接收設備和數據讀取方法
- 數據記錄方法、數據記錄裝置、數據記錄媒體、數據重播方法和數據重播裝置
- 數據發送方法、數據發送系統、數據發送裝置以及數據結構
- 數據顯示系統、數據中繼設備、數據中繼方法及數據系統
- 數據嵌入裝置、數據嵌入方法、數據提取裝置及數據提取方法
- 數據管理裝置、數據編輯裝置、數據閱覽裝置、數據管理方法、數據編輯方法以及數據閱覽方法
- 數據發送和數據接收設備、數據發送和數據接收方法
- 數據發送裝置、數據接收裝置、數據收發系統、數據發送方法、數據接收方法和數據收發方法
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置





