[發明專利]一種基于主動學習的圖像標注方法有效
| 申請號: | 201410106864.1 | 申請日: | 2014-03-20 |
| 公開(公告)號: | CN103942561B | 公開(公告)日: | 2017-03-29 |
| 發明(設計)人: | 陳晉音;黃堅 | 申請(專利權)人: | 杭州禧頌科技有限公司 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62 |
| 代理公司: | 杭州求是專利事務所有限公司33200 | 代理人: | 張法高 |
| 地址: | 311100 浙江省杭州*** | 國省代碼: | 浙江;33 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 主動 學習 圖像 標注 方法 | ||
技術領域
本發明涉及網絡圖像標注技術,主動學習技術和SVM分類器,尤其涉及采用主動學習進行圖像標注方法。
背景技術
近年來,伴隨著計算機視覺技術和機器學習算法的興起,基于圖像內容的網絡圖像自動標注技術得到飛速發展。通用的圖像標注流程包括:(1)圖像視覺特征提取和表達;(2)基于訓練數據對分類器或者搜索模型進行訓練;(3)使用訓練好的分類器或者搜索模型對圖像進行分類或者是搜索近鄰,實現對圖像的標注。
從上面的通用圖像標注流程可以看出無論是分類器還是搜索模型的構建通常都是需要訓練數據集的支撐。而構建這樣的訓練數據,經常需要對圖像數據進行標注,比較耗時同時也是比較繁瑣的。為了節省人工標注的勞動量,以往的研究工作一般是從兩個方法來解決這個問題。
第一種解決思路是采用半監督學習的方法,只對訓練數據集中的少量數據進行標注,然后將數據集中大量的未標注的數據加入到模型的訓練中,通過挖掘圖像之間存在的特征空間上的近鄰關系來提高算法的準確性。
第二種解決思路是采用主動學習的方法,通過采用某種策略和方法,主動地從訓練數據集中挑選出部分具有代表性或者是最具模糊性的圖像數據,對這些數據進行人工標注,然后利用這些標注的數據集對算法模型進行訓練。由于標注的數據是經過智能選擇過的,因此使用這些的標注數據進行模型訓練,可以進一步提高算法的準確率。
關于第一種解決思路的相關工作可以參考Xiaojin?Zhu的《Semi-supervised?Learning?Survey》一文。第二中解決思路是與本發明所提出的方法關系最密切的。這類工作包括支持向量機主動學習(Support?Vector?Machine?active?learning,SVMactive),基于回歸的主動學習方法(Regression?based?active?learning),基于最優實驗設計(Optimal?Experiment?Design,OED)類的主動學習方法和基于圖的主動學習方法,如Laplacian?Optimal?Design(LOD)等
與上面介紹的方法不同,本發明所提出的方法采用貪心算法求解需要標注的圖像數據,在得到用戶標注圖像結果后,我們將其應用到多類別SVM模型中,訓練SVM模型,然后應用訓練結果對數據集中的其他圖像進行自動標注。
發明內容
本發明的目的是為了克服在訓練SVM算法模型是需要提供大量人工標注的圖像數據,耗費時間和人力的問題,提供一種基于主動學習的網絡圖像標注方法。
基于主動學習的網絡圖像標注方法包括如下步驟:
1)對網絡圖像數據集MSRA-MM數據集中,選擇80類圖像,每類100張圖像,共計8000張圖像,提取64維的顏色直方圖和255維的顏色紋理矩特征,構成319維的圖像視覺特征表達,得到圖像特征集X=[x1,x2,...,xn]∈Rd×n,其中d=319為圖像特征維度,n=8000為圖像樣本數;
2)構建表征圖像視覺相似性關系的K近鄰圖結構,以圖像特征集中樣本作為K近鄰圖的頂點,K近鄰圖的邊權重矩陣S設置如下:
其中,Νk(xj)和Νk(xi)分別表示xj和xi的K近鄰;
3)根據S矩陣,計算相應的拉普拉斯圖矩陣L,計算公式如下:
L=S-D2
其中,D為對角矩陣,對角元素值
4)初始化用戶標注圖像樣本z1為:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于杭州禧頌科技有限公司,未經杭州禧頌科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201410106864.1/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種可自動調節的壓脈帶
- 下一篇:低溫液體運輸半掛車的行走機構
- 彩色圖像和單色圖像的圖像處理
- 圖像編碼/圖像解碼方法以及圖像編碼/圖像解碼裝置
- 圖像處理裝置、圖像形成裝置、圖像讀取裝置、圖像處理方法
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序以及圖像解碼程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序、以及圖像解碼程序
- 圖像形成設備、圖像形成系統和圖像形成方法
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序





