[發明專利]一種多類圖像半監督分類方法及系統在審
| 申請號: | 201410708851.1 | 申請日: | 2014-11-28 |
| 公開(公告)號: | CN104463202A | 公開(公告)日: | 2015-03-25 |
| 發明(設計)人: | 張召;梁雨宸;李凡長;張莉 | 申請(專利權)人: | 蘇州大學 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62 |
| 代理公司: | 北京集佳知識產權代理有限公司 11227 | 代理人: | 常亮 |
| 地址: | 215123 江蘇*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 圖像 監督 分類 方法 系統 | ||
技術領域
本申請涉及數據挖掘、機器學習及模式分類技術領域,特別是涉及一種多類圖像半監督分類方法及系統。
背景技術
隨著信息和數據爆炸時代的到來,分類技術成為數據挖掘、模式識別等領域中最重要的研究課題之一。分類主要實現未知類別的數據的歸類,在醫療數據分析、信用卡的信用分級和圖像分類等領域有著重大的意義,一旦研究成功并投入應用,將產生巨大的社會和經濟效益。但是真實世界中的數據(例如互聯網中的圖像)大多是無類別標簽的,且樣本的人工標定過程非常費時費力且昂貴,使得數據的準確分類有一定難度。最近,基于相似圖構造的半監督學習方法在數據挖掘和模式分類等相關領域已經興起成為強大而流行的有效工具。基于真實世界中的數據特點,半監督學習主要通過有標定樣本的類別,和有標簽與無標簽樣本間的相似性,揭示出無標簽樣本的類別。
近年來,由于基于標簽傳播理論的學習過程具有簡單有效、快速等優點,故已成為半監督學習的典型代表之一。作為一種基于圖的半監督學習方法,標簽傳播根據有標簽和無標簽樣本間的內在關聯信息,將有標簽樣本的標簽信息傳播給無標簽樣本,完成無標簽樣本的類別估計。標簽傳播用于半監督分類的思想于2002年由Zhu等人提出,因其效率高、復雜度低等優點引起國內外學者廣泛關注,并逐漸被證實為一種簡單、速度極快、可擴展性強、性能較為穩定的算法,并被廣泛的運用在許多領域,如社交網絡中的社會關系分析、多媒體信息檢索分類等。經典的標簽傳播算法包括GFHF、LLGC、LNP和SLP等。目前幾乎所有的研究都著眼于改進相似圖的構建來提高分類性能,也取得了一些成績。但是現有方法仍有一些缺點,例如,如何有效去除預測得到的“軟類別標簽”預測矩陣中的混合信號及其對分類結果的影響,以及輸出的軟類別標簽信息是否總是滿足概率的定義(即概率和為1與非負)等。
因此,提出一種基于增強型標簽傳播的多類圖像半監督歸納式分類新方法,確保輸出結果充分稀疏和滿足概率定義,提高算法的適用性和魯棒性,增強分類性能,是本領域人員亟待解決的問題。
發明內容
有鑒于此,本申請提供一種多類圖像半監督分類方法及系統,以自動實現對圖像的分類,提高圖像分類效率、降低圖像分類成本。
為了實現上述目的,本發明實施例提供的技術方案如下:
一種多類圖像半監督分類方法,包括:
對訓練集中的有標簽圖像樣本和無標簽圖像樣本進行相似性學習,構造相似近鄰圖,計算得到權重系數矩陣,并對所述權重系數矩陣進行對稱化、歸一化處理;
根據所述訓練集中有標簽圖像樣本的類別標簽信息,初始化一個類標簽矩陣,其中,所述類標簽矩陣中額外添加第(c+1)類用于檢測異類/未發現的新穎類,c為有標簽圖像樣本的總類別數;
引入l2,1-范數正則化技術,非負約束,以及列和為1的約束,并基于所述類標簽矩陣及對稱化、歸一化處理后的權重系數矩陣進行非負稀疏標簽傳播的迭代過程,得到“軟類別標簽”預測矩陣;
根據所述“軟類別標簽”預測矩陣表征的相似性概率,預測所述訓練集中無標簽圖像樣本的準確類別,得到直推式圖像分類結果,訓練完成半監督分類建模,生成訓練模型;
利用所述訓練模型對測試集中的無標簽待分類的圖像樣本進行類別信息的預測,得到所述測試集中的無標簽待分類的圖像樣本的類別標簽,以實現對訓練集以外數據的歸納過程。
優選的,所述訓練集和測試集的生成過程為:
接收圖像樣本集合,并將圖像進行向量化描述;
從進行向量化描述后的圖像樣本集合中選出部分圖像樣本數據作為訓練集,其余的圖像樣本數據作為測試集,其中,所述訓練集中包含少量有標簽圖像樣本和適量的無標簽圖像樣本,所述測試集中包含大量無標簽的待分類圖像樣本。
優選的,所述對訓練集中的有標簽圖像樣本和無標簽圖像樣本進行相似性學習,構造相似近鄰圖,計算得到權重系數矩陣,對所述權重系數矩陣進行對稱化、歸一化處理的過程為:
基于所述訓練集進行K最近鄰搜索,構造近鄰圖G,找出所述訓練集中每個圖像樣本的K個最近鄰的圖像樣本,所述訓練集中的圖像樣本包括有標簽圖像樣本和無標簽圖像樣本;
采用Locally?Linear?Embedding(LLE)-重構權的構造方法,計算、衡量近鄰圖G中的頂點之間的相似性,構造權重系數矩陣;
將所述權重系數矩陣進行各行求和得到一個對角矩陣,其中,所述對角矩陣中的對角元素表征各個頂點在圖中的重要性;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于蘇州大學,未經蘇州大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201410708851.1/2.html,轉載請聲明來源鉆瓜專利網。
- 彩色圖像和單色圖像的圖像處理
- 圖像編碼/圖像解碼方法以及圖像編碼/圖像解碼裝置
- 圖像處理裝置、圖像形成裝置、圖像讀取裝置、圖像處理方法
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序以及圖像解碼程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序、以及圖像解碼程序
- 圖像形成設備、圖像形成系統和圖像形成方法
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序





