[發明專利]一種結合標注質量控制的主動學習方法在審
| 申請號: | 202110036696.3 | 申請日: | 2021-01-12 |
| 公開(公告)號: | CN112766347A | 公開(公告)日: | 2021-05-07 |
| 發明(設計)人: | 宋艷枝;王星宇 | 申請(專利權)人: | 合肥黎曼信息科技有限公司 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62;G06N3/08 |
| 代理公司: | 安徽省蚌埠博源專利商標事務所(普通合伙) 34113 | 代理人: | 朱恒蘭 |
| 地址: | 230001 安徽省合肥市高新區創新*** | 國省代碼: | 安徽;34 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 結合 標注 質量 控制 主動 學習方法 | ||
1.一種結合標注質量控制的主動學習方法,包括以下步驟:
S1:訓練模型;
S2:對全部未標注樣本進行偽標注;
S3:分折計算觀測距離
S4:基于觀測距離挑選待標注和待檢查的樣本,對于需要標注的樣本,將其標注后加入已標注樣本集,對于需要檢查的樣本,對其進行一次額外的標注,再基于已有的歷史標注確定其標注,然后更新已標注樣本集,完成本步驟后返回步驟S1,直到模型性能可以接受,或者達到了標注預算限制。
2.根據權利要求1所述結合標注質量控制的主動學習方法,其特征在于:所述的步驟S3中的觀測距離采用分折實驗的方法計算。
3.根據權利要求1所述結合標注質量控制的主動學習方法,其特征在于:所述的方法還包括選擇待標注樣本和待檢查標注的指標,包括使用預測距離選擇待標注樣本,使用標注距離選擇待檢查的標注,還包括基于三角不等式使用觀測距離作為預測距離和標注距離的下界。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于合肥黎曼信息科技有限公司,未經合肥黎曼信息科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110036696.3/1.html,轉載請聲明來源鉆瓜專利網。





