[發明專利]一種基于預測結果篩選的魯棒數字圖像標注方法有效
| 申請號: | 201710298619.9 | 申請日: | 2017-04-27 |
| 公開(公告)號: | CN107122800B | 公開(公告)日: | 2020-09-18 |
| 發明(設計)人: | 李宇峰;王少博;周志華 | 申請(專利權)人: | 南京大學 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62 |
| 代理公司: | 南京蘇高專利商標事務所(普通合伙) 32204 | 代理人: | 李玉平 |
| 地址: | 210046 江蘇*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 預測 結果 篩選 數字圖像 標注 方法 | ||
本發明公開了一種基于預測結果篩選的魯棒機器學習方法,用于獲得更可靠的數字圖像標注結果。具體而言,本發明采用機器學習中的經典思想——最大化間隔原理,對待標注的數字圖像在多種相似度度量下得到的預測結果進行篩選,選取其中間隔最大的結果作為最終預測結果輸出,完成對數字圖像的標注。預測結果具有大間隔理論上避免了預測結果難以區分的情況,具有不錯的魯棒性。為了顯示地計算間隔,本發明采用機器學習經典損失函數來衡量預測結果的區分程度,從而得到間隔的大小。其中,損失函數指預測結果(連續值)與候選的預測標記(離散值)之間的差距,該損失越小代表了預測結果的間隔越大。
技術領域
本發明涉及一種基于預測結果篩選的魯棒數字圖像標注方法,屬于機器學習技術領域。
背景技術
隨著各類社交網站的廣泛流行以及數碼產品的大量普及,每時每刻都有海量的數字圖像產生并傳播。要在如此大規模的圖像數據上提供相關服務,一個最核心也是最困難的任務是讓計算機自動理解圖像的語義,而圖像標注則是其中的關鍵技術。自動圖像標注的任務是基于數字圖像的視覺特征來預測其語義標記。具體而言,首先從數字圖像中抽取視覺特征來表示這些圖像示例,然后基于這些特征表示,從已經具有語義標記的圖像數據集合中訓練出一個標注模型。將待預測標記的數字圖像對應的特征表示輸入標注模型后,模型就能對它們的語義標記做出預測。傳統的數字圖像標注技術往往僅利用已經具有語義標記的圖像數據,即采用監督學習的方式。然而互聯網上存在著大量的原始圖像數據,這些數字圖像非常容易獲取但本身不具有語義標記(即未標記數據)。如何有效地利用大量“便宜的”未標記數據來幫助提高標注模型的性能,具有很強的現實意義,已成為機器學習領域的一個重要研究課題,這類方法稱為半監督學習方法。
盡管針對數字圖像標注的任務,采用半監督學習方法通常能夠取得比采用監督學習方法更好的標注性能,但依然存在性能不魯棒的問題,甚至在某些情況下不如采用監督學習方法的性能。具體而言,針對數字圖像的數據特征,圖像標注任務通常采用相似相近原理——相似示例具有相似標注,構建半監督學習方法。這類方法的關鍵是刻畫示例的相似性。因此,學習方法的性能極大地依賴于示例的相似度度量。雖然已有許多研究者提出了各種各樣的度量方法,但在實際任務中,如何構建可靠的相似度度量使得半監督學習方法的性能不受損害,依然是一個開放性的問題。針對數字圖像標注任務而言,至今并沒有任何研究成果表明某一種相似度度量特別適于此類任務,這便導致了在實際應用中用戶采用半監督學習方式來訓練標注模型時面臨諸多相似度度量上的選擇問題,如若選擇不當,將會使所得標注模型的標注能力受到極大影響,繼而對用戶造成損失,尤其當錯誤的標注會帶來嚴重后果時,如醫療影像標注任務等,則影響更甚。因此,急需一種魯棒的學習方法用于數字圖像標注任務。
發明內容
發明目的:針對目前半監督學習方法用于數字圖像標注任務時,存在性能退化的問題,本發明提供了一種基于預測結果篩選的魯棒數字圖像標注方法,用于獲得更可靠的數字圖像標注結果。具體而言,本發明采用機器學習中的經典思想——最大化間隔思想,對待標注的數字圖像在多種相似度度量下得到的預測結果進行篩選,選取其中間隔最大的結果作為最終預測結果輸出,用以完成對數字圖像的標注。預測結果具有大間隔在一定程度上避免了預測結果不能區分,從而具有較高的可靠性。為了刻畫間隔,本發明采用損失函數的方式衡量預測結果的間隔大小。損失函數用于計算預測值(連續值)與對應的預測標記(離散值)之間的差距,該損失越小代表了這組預測結果的間隔越大。
技術方案:一種基于預測結果篩選的魯棒數字圖像標注方法,主要包括以下一系列步驟:
(1)通過采用半監督學習方法并應用多種相似度度量,獲得當前待標注圖像的多組相關語義標記的預測結果;
(2)對每組預測值,應用經典損失函數計算其間隔大小;
(3)選取損失最小的一組預測值作為最終預測結果,對相應的數字圖像進行標注。
附圖說明
圖1是數字圖像標注的工作流程圖;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于南京大學,未經南京大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710298619.9/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:基于擴展形態學和導向濾波的高光譜圖像分類方法
- 下一篇:圖像分類的方法和裝置





