[發明專利]一種半自動化標注方法、設備、介質及裝置在審
| 申請號: | 202010617664.8 | 申請日: | 2020-06-30 |
| 公開(公告)號: | CN111815689A | 公開(公告)日: | 2020-10-23 |
| 發明(設計)人: | 趙鑫;王偉;吳鵬 | 申請(專利權)人: | 杭州科度科技有限公司 |
| 主分類號: | G06T7/33 | 分類號: | G06T7/33;G06T7/187;G06T7/11;G06T7/44;G06T7/62;G06T5/50;G06T5/40;G06K9/62 |
| 代理公司: | 杭州創智卓英知識產權代理事務所(普通合伙) 33324 | 代理人: | 唐超文 |
| 地址: | 310000 浙江省杭州市余杭*** | 國省代碼: | 浙江;33 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 半自動 標注 方法 設備 介質 裝置 | ||
本發明公開了一種半自動化標注方法,圖像標注技術領域,包括如下步驟:對圖片初始化每個像素生成區域,作為候選區域,對所有相鄰的候選區域進行兩兩配對,生成計算列表;根據計算列表進行相似度計算,包括顏色相似度計算和紋理值相似度計算,分別得出第一得分和第二得分;根據計算列表進行分值計算,得出第三得分;根據第一得分、第二得分和第三得分,相加計算得到的相似度,對列表中達到相似度合并閾值的進行兩兩合并,直到所有候選區域完成合并。本發明采用半自動標注方法生成標簽候選框后,人工只需要選擇合適的候選框即可,大大節省了標注時間,提高了標注效率。本發明還公開了一種半自動化標注裝置、電子設備和計算機存儲介質。
技術領域
本發明涉及圖像標注技術領域,尤其涉及一種半自動化標注方法、設備、介質及裝置。
背景技術
隨著機器學習的蓬勃發展,人工智能領域已經越來越離不開機器學習了,然而機器學習需要大量的訓練數據,訓練數據需要人工打上標簽,然而訓練數據通常為幾萬條,甚至上百萬條。而純人工標注需要手工描邊,工作量非常大。
并且人工標注會出現較大誤差,對機器學習的模型造成不必要的影響。而現有的算法本身就具有特化性,只針對某一種特定物體檢測,所以不能作為通用的物體標注輔助。
發明內容
為了克服現有技術的不足,本發明的目的之一在于提供一種半自動化標注方法,能解決人工標注存在的誤差、效率低下的問題。
本發明的目的之一采用以下技術方案實現:
一種半自動化標注方法,包括如下步驟:
對圖片初始化每個像素生成區域,作為候選區域,對所有相鄰的候選區域進行兩兩配對,生成計算列表;
根據計算列表進行相似度計算,包括顏色相似度計算和紋理值相似度計算,分別得出第一得分和第二得分;
根據計算列表進行分值計算,得出第三得分;
根據第一得分、第二得分和第三得分,相加計算得到的相似度,對列表中達到相似度合并閾值的進行兩兩合并,直到所有候選區域完成合并。
本實施例中,計算列表為相鄰的候選區域進行的兩兩配對,比如有甲、乙、丙三個候選區域相互相鄰,則計算列表包含甲乙,乙丙和甲丙。
進一步地,顏色相似度計算過程包括:
對兩個候選區域生成顏色直方圖,以每5個像素為一段進行分段;
統計每段里面點的個數,并進行歸一化計算;
對兩個候選區域的直方圖相似度進行比較,兩個直方圖之間每段對位均取最小值全部相加,作為第一得分。
進一步地,紋理值相似度計算過程包括:
紋理值根據SIFT算法,對每個像素點的每個通道提取一個紋理值,構建直方圖;
對兩個候選區域的直方圖,以每5個像素為一段進行分段;
統計每段里面點的個數,并進行歸一化計算;
對兩個候選區域的直方圖相似度進行比較,兩個直方圖之間每段對位均取最小值全部相加,作為第二得分。
進一步地,分值的計算公式為:
1-(S1+S2)/Stotal;
其中,S1和S2分別為兩個相鄰的候選區域,Stotal為圖像總面積。
進一步地,對列表中達到相似度合并閾值的進行兩兩合并,過程包括:
設置相似度合并閾值;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于杭州科度科技有限公司,未經杭州科度科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010617664.8/2.html,轉載請聲明來源鉆瓜專利網。





