[發明專利]標簽校驗方法和設備在審
| 申請號: | 202010193375.X | 申請日: | 2020-03-18 |
| 公開(公告)號: | CN113496232A | 公開(公告)日: | 2021-10-12 |
| 發明(設計)人: | 姚沛;張勍穎 | 申請(專利權)人: | 杭州??低晹底旨夹g股份有限公司 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62;G06N20/00 |
| 代理公司: | 北京博思佳知識產權代理有限公司 11415 | 代理人: | 楊春香 |
| 地址: | 310051 浙*** | 國省代碼: | 浙江;33 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 標簽 校驗 方法 設備 | ||
本申請提供了標簽校驗方法和設備。本申請中,通過提前利用原始訓練圖片和原始訓練圖片對應的原始訓練標簽生成與原始訓練圖片對應的圖片?標簽校驗數據(至少包括原始訓練標簽),之后在訓練深度學習模型時,或者在訓練深度學習模型前,利用原始訓練圖片對應的圖片?標簽校驗數據(至少包括原始訓練標簽)校驗原始訓練圖片當前對應的當前訓練標簽,以及時糾正原始訓練圖片當前對應的錯誤的訓練標簽,大大減少了原始訓練圖片當前對應的原始訓練標簽被篡改、出錯等風險,保證了模型訓練過程的穩定性。
技術領域
本申請涉及計算機技術,特別涉及標簽校驗方法和設備。
背景技術
深度學習模型的訓練離不開訓練數據集。訓練數據集主要包括訓練圖片和訓練標簽。這里,訓練標簽與訓練圖片是一一對應的,用于標注其對應的訓練圖片的信息比如圖片類別、圖片路徑等。為便于描述,在初始的訓練圖片也稱原始訓練圖片,原始訓練圖片初始對應的訓練標簽稱為原始訓練標簽。
在應用中,原始訓練圖片是不會被修改的。而原始訓練圖片初始對應的原始訓練標簽則會很容易被篡改、甚至被丟失等。一旦原始訓練標簽被篡改、甚至被丟失,則會影響深度學習模型的訓練。
發明內容
本申請提供了標簽校驗方法和設備,以實現對原始訓練圖片當前對應的當前訓練標簽進行校驗。
在一個方面,本申請提供了一種標簽校驗方法,該方法包括:
利用原始訓練圖片和原始訓練圖片對應的原始訓練標簽生成與原始訓練圖片對應的圖片-標簽校驗數據;所述圖片-標簽校驗數據至少包括:所述原始訓練標簽;
在確定對原始訓練圖片當前對應的當前訓練標簽進行校驗時,依據已生成的與所述原始訓練圖片對應的圖片-標簽校驗數據對原始訓練圖片當前對應的當前訓練標簽進行校驗,并在原始訓練圖片當前對應的當前訓練標簽未通過校驗時,利用已生成的所述原始訓練圖片對應的所述圖片-標簽校驗數據更新原始訓練圖片當前對應的當前訓練標簽。
作為一個實施例,所述利用原始訓練圖片和原始訓練圖片對應的原始訓練標簽生成與原始訓練圖片對應的圖片-標簽校驗數據,包括:
獲取原始訓練圖片和原始訓練圖片對應的原始訓練標簽;
將獲取到的原始訓練圖片對應的原始訓練標簽添加至原始訓練圖片的指定位置,得到原始訓練圖片對應的圖片-標簽校驗數據。
作為一個實施例,所述指定位置為:尾部,或者頭部。
作為一個實施例,所述確定對原始訓練圖片當前對應的當前訓練標簽進行校驗包括:
當已接收到外部觸發的針對所述原始訓練圖片的標簽校驗指令時,確定對所述原始訓練圖片當前對應的當前訓練標簽進行校驗;或者,
在檢測到深度學習模型的測試精度值小于設定精度值時,若所述原始訓練圖片、以及所述原始訓練圖片當前對應的當前訓練標簽當前還未參與到所述深度學習模型的訓練,則確定對所述原始訓練圖片當前對應的當前訓練標簽進行校驗;所述測試精度值是通過測試樣本測試出的所述深度學習模型的精度值。
作為一個實施例,所述依據已生成的所述原始訓練圖片對應的圖片-標簽校驗數據對原始訓練圖片當前對應的當前訓練標簽進行校驗包括:
從已生成的所述原始訓練圖片對應的圖片-標簽校驗數據中讀取原始訓練標簽;
比較讀取到的原始訓練標簽與所述原始訓練圖片當前對應的當前訓練標簽是否一致,如果一致,則確定原始訓練圖片當前對應的當前訓練標簽通過校驗,如果不一致,則確定原始訓練圖片當前對應的當前訓練標簽未通過校驗。
作為一個實施例,所述利用已生成的所述原始訓練圖片對應的所述圖片-標簽校驗數據更新原始訓練圖片當前對應的當前訓練標簽包括:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于杭州??低晹底旨夹g股份有限公司,未經杭州??低晹底旨夹g股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010193375.X/2.html,轉載請聲明來源鉆瓜專利網。





