[發明專利]樣本標注審核方法及裝置有效
| 申請號: | 201910538182.0 | 申請日: | 2019-06-20 |
| 公開(公告)號: | CN110245716B | 公開(公告)日: | 2021-05-14 |
| 發明(設計)人: | 徐青松;李青 | 申請(專利權)人: | 杭州睿琪軟件有限公司 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62 |
| 代理公司: | 上海思捷知識產權代理有限公司 31295 | 代理人: | 王宏婧 |
| 地址: | 310053 浙江省杭州市濱江*** | 國省代碼: | 浙江;33 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 樣本 標注 審核 方法 裝置 | ||
本發明提供了一種樣本標注審核方法及裝置,方法包括:獲取待標注樣本;通過區域識別模型識別所述待標注樣本的至少一個區域,并對所述至少一個區域進行切割形成至少一個樣本區域圖片;通過預設識別模型識別每個樣本區域圖片并進行預標注處理;將經過預標注處理的樣本區域圖片發送給審核單元,以使所述審核單元對樣本區域圖片的預標注結果進行審核,如果審核出所述預標注結果為錯誤則對所述預標注結果進行修改;將經過審核單元審核的樣本區域圖片發送給校驗客戶端,以使所述校驗客戶端對經過審核單元審核后的樣本區域圖片的標注信息進行校驗處理。本發明可以提高樣本標注的準確率。
技術領域
本發明涉及人工智能技術領域,尤其涉及一種樣本標注審核方法、裝置、電子設備和計算機可讀存儲介質。
背景技術
在人工智能領域,在進行模型訓練之前,需要對訓練樣本進行標注。通常可以人工客戶端或識別模型對訓練樣本進行標注,但是這無法保證樣本的標注準確率。
發明內容
本發明的目的在于提供一種樣本標注審核方法、裝置、電子設備和計算機可讀存儲介質,以提高樣本標注的準確率。具體技術方案如下:
第一方面,本發明提供了一種樣本標注審核方法,所述方法包括:
步驟1:獲取待標注樣本;
步驟2:通過區域識別模型識別所述待標注樣本的至少一個區域,并對所述至少一個區域進行切割形成至少一個樣本區域圖片;其中,所述區域識別模型為基于神經網絡的模型;
步驟3:通過預設識別模型識別每個樣本區域圖片并進行預標注處理;其中,所述預設識別模型為基于神經網絡的模型;
步驟4:將經過預標注處理的樣本區域圖片發送給審核單元,以使所述審核單元對樣本區域圖片的預標注結果進行審核,如果審核出所述預標注結果為錯誤則對所述預標注結果進行修改;
步驟5:將經過審核單元審核的樣本區域圖片發送給校驗客戶端,以使所述校驗客戶端對經過審核單元審核后的樣本區域圖片的標注信息進行校驗處理。
可選的,步驟3通過預設識別模型識別每個樣本區域圖片并進行預標注處理,包括:
通過一個預設識別模型識別每個樣本區域圖片并進行預標注處理;
步驟4將經過預標注處理的樣本區域圖片發送給審核單元,以使所述審核單元對樣本區域圖片的預標注結果進行審核,包括:
將經過預標注處理的樣本區域圖片發送給一個人工客戶端,以使所述人工客戶端對樣本區域圖片的預標注結果進行審核。
可選的,步驟5所述校驗客戶端對經過審核單元審核后的樣本區域圖片的標注信息進行校驗處理,包括:
針對每個樣本區域圖片,校驗客戶端檢驗經過該人工客戶端審核后的該樣本區域圖片的標注信息是否準確,如果不準確則重新對該樣本區域圖片進行識別。
可選的,步驟3通過預設識別模型識別每個樣本區域圖片并進行預標注處理,包括:
將每個樣本區域圖片均通過至少兩個預設識別模型分別進行識別并進行預標注處理;
步驟4將經過預標注處理的樣本區域圖片發送給審核單元,以使所述審核單元對樣本區域圖片的預標注結果進行審核,包括:
將通過不同預設識別模型進行預標注處理的樣本區域圖片同時發送給不同的人工客戶端,以使人工客戶端對樣本區域圖片的預標注結果進行審核。
可選的,步驟5所述校驗客戶端對經過審核單元審核后的樣本區域圖片的標注信息進行校驗處理,包括:
針對每個樣本區域圖片,校驗客戶端檢驗經過不同的人工客戶端審核后的該樣本區域圖片的標注信息是否一致,如果不一致則對該樣本區域圖片重新進行識別。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于杭州睿琪軟件有限公司,未經杭州睿琪軟件有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910538182.0/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:用于精準切負荷的用戶劃分方法
- 下一篇:一種基于機器學習的基因表達譜聚類方法





