[發明專利]樣本標注審核方法及裝置有效
| 申請號: | 201910538182.0 | 申請日: | 2019-06-20 |
| 公開(公告)號: | CN110245716B | 公開(公告)日: | 2021-05-14 |
| 發明(設計)人: | 徐青松;李青 | 申請(專利權)人: | 杭州睿琪軟件有限公司 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62 |
| 代理公司: | 上海思捷知識產權代理有限公司 31295 | 代理人: | 王宏婧 |
| 地址: | 310053 浙江省杭州市濱江*** | 國省代碼: | 浙江;33 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 樣本 標注 審核 方法 裝置 | ||
1.一種樣本標注審核方法,其特征在于,所述方法包括:
步驟1:獲取待標注樣本;
步驟2:通過區域識別模型識別所述待標注樣本的至少一個區域,并對所述至少一個區域進行切割形成至少一個樣本區域圖片;其中,所述區域識別模型為基于神經網絡的模型;
步驟3:通過預設識別模型識別每個樣本區域圖片并進行預標注處理;其中,所述預設識別模型為基于神經網絡的模型;
步驟4:將經過預標注處理的樣本區域圖片發送給審核單元,以使所述審核單元對樣本區域圖片的預標注結果進行審核,如果審核出所述預標注結果為錯誤則對所述預標注結果進行修改;
步驟5:將經過審核單元審核的樣本區域圖片發送給校驗客戶端,以使所述校驗客戶端對經過審核單元審核后的樣本區域圖片的標注信息進行校驗處理;
步驟3進行預標注處理之后,還包括:
從所述預設識別模型識別的樣本區域圖片中選取預設數量個圖片,并將所選取的預設數量個圖片的預標注結果修改為與原始預標注結果不同的識別結果;
步驟4中將經過預標注處理的樣本區域圖片發送給審核單元,以使所述審核單元對樣本區域圖片的預標注結果進行審核,包括:
將未修改預標注結果的樣本區域圖片和已修改預標注結果的樣本區域圖片都發送給審核單元,以使所述審核單元對未修改預標注結果的樣本區域圖片和已修改預標注結果的樣本區域圖片的預標注結果進行審核;
步驟5中所述校驗客戶端對經過審核單元審核后的樣本區域圖片的標注信息進行校驗處理之后,還包括:
所述校驗客戶端根據所述審核單元對已修改預標注結果的所述預設數量個圖片的審核結果,檢查所述審核單元是否處于異常狀態。
2.如權利要求1所述的樣本標注審核方法,其特征在于,步驟3通過預設識別模型識別每個樣本區域圖片并進行預標注處理,包括:
通過一個預設識別模型識別每個樣本區域圖片并進行預標注處理;
步驟4將經過預標注處理的樣本區域圖片發送給審核單元,以使所述審核單元對樣本區域圖片的預標注結果進行審核,包括:
將經過預標注處理的樣本區域圖片發送給一個人工客戶端,以使所述人工客戶端對樣本區域圖片的預標注結果進行審核。
3.如權利要求2所述的樣本標注審核方法,其特征在于,步驟5所述校驗客戶端對經過審核單元審核后的樣本區域圖片的標注信息進行校驗處理,包括:
針對每個樣本區域圖片,校驗客戶端檢驗經過該人工客戶端審核后的該樣本區域圖片的標注信息是否準確,如果不準確則重新對該樣本區域圖片進行識別。
4.如權利要求1所述的樣本標注審核方法,其特征在于,步驟3通過預設識別模型識別每個樣本區域圖片并進行預標注處理,包括:
將每個樣本區域圖片均通過至少兩個預設識別模型分別進行識別并進行預標注處理;
步驟4將經過預標注處理的樣本區域圖片發送給審核單元,以使所述審核單元對樣本區域圖片的預標注結果進行審核,包括:
將通過不同預設識別模型進行預標注處理的樣本區域圖片同時發送給不同的人工客戶端,以使人工客戶端對樣本區域圖片的預標注結果進行審核。
5.如權利要求4所述的樣本標注審核方法,其特征在于,步驟5所述校驗客戶端對經過審核單元審核后的樣本區域圖片的標注信息進行校驗處理,包括:
針對每個樣本區域圖片,校驗客戶端檢驗經過不同的人工客戶端審核后的該樣本區域圖片的標注信息是否一致,如果不一致則對該樣本區域圖片重新進行識別。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于杭州睿琪軟件有限公司,未經杭州睿琪軟件有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910538182.0/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:用于精準切負荷的用戶劃分方法
- 下一篇:一種基于機器學習的基因表達譜聚類方法





