[發明專利]一種基于主動學習的高光譜圖像分類方法有效
| 申請號: | 201410066856.9 | 申請日: | 2014-02-26 |
| 公開(公告)號: | CN103839078B | 公開(公告)日: | 2017-10-27 |
| 發明(設計)人: | 王爽;焦李成;吳林生;侯彪;馬文萍;馬晶晶;牛東 | 申請(專利權)人: | 西安電子科技大學 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62 |
| 代理公司: | 西安智萃知識產權代理有限公司61221 | 代理人: | 李東京 |
| 地址: | 710071 陜西省*** | 國省代碼: | 陜西;61 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 主動 學習 光譜 圖像 分類 方法 | ||
技術領域
本發明屬于圖像處理領域,特別是一種基于主動學習的高光譜圖像分類方法,可應用于目標識別。
背景技術
伴隨著遙感技術的不斷進步,遙感傳感器能夠提供越來越多的數據。如何處理這些數據在遙感領域已經產生了巨大的興趣。在遙感應用方面,例如環境檢測、農業管理和城市繪圖等,地物分類是非常重要的。利用這些數據所包含的豐富信息來獲得高的分類精度,對于我們來說是一個巨大的挑戰。特別地,在高光譜數據中光譜信息是極其的豐富。一幅高光譜圖像也許包含有上百萬個像素,每一個像素包括成百上千個光譜帶,這使得人工標記變得很困難。因此,自動地物分類與識別正在成為一個熱點。
許多關于遙感圖像的自動分類技術的研究均是建立在監督學習方法的基礎之上。監督學習的含義為:在已標記數據集上訓練得到一個分類器,然后該分類器被用來預測未標記樣本的標記。在機器學習領域,大量的分類器已經被開發出來。但是,監督學習器的分類性能依賴于可得到的已標記樣本的數目與質量。已標記數據集的大小和一個分類器的分類精度之間通常是正相關的。換句話說,為了得到高的分類精度,已標記樣本的數目應該盡可能的大。然而,對于高光譜數據,由于維數通常很高,該問題顯得更加嚴重。當訓練樣本的數目對特征的數目的比率較小時,也許會發生維數災難。因此,對于高光譜數據來說,很容易就發生過擬合訓練數據的現象,這給分類器的泛化能力帶來了不利的影響。
在現實生活中,要獲得遙感數據的標記是非常昂貴并耗時的,因為需要專家人為標記或者實地勘察。因此,如何利用盡可能少的已標記樣本來獲得盡可能高的分類精度在遙感數據分類中起著非常重要的作用。主動學習剛好就是被設計用來強調這類問題。主動學習的目地在于挑選出最具有信息量的未標記樣本用于人工標記,這樣一個分類器就能夠利用盡可能少的已標記樣本來獲得盡可能高的分類精度。說的更具體一點,在已標記數據集上訓練得到一個分類器,該分類器被用來預測未標記樣本的標記。基于預先定義的查詢策略,獲得了每一個未標記樣本的信息量。根據信息量的排序挑選出固定數目的最高信息量的樣本。分析人員人工地標記這部分最高信息量的樣本,該分類器在擴大的已標記數據集上重新訓練。該過程重復進行直到一些停止條件被滿足。這個過程中最重要的一步是如何度量未標記樣本的信息量。如果使用更好的度量方法就能夠期待獲得更好的分類性能。在機器學習領域中,有關主動學習技術的研究有很多。近些年,主動學習在遙感領域已經引起了極大的興趣。
查詢策略在主動學習中非常重要,基于集成的查詢是其中一種查詢策略之一,它根據集成的不一致性程度來評估未標記樣本的信息量,如下所示:
上式中,xu為未標記樣本,yi取遍所有的可能的標記,v(yi)為所有那些預測得到的類別標記是yi的分類器的數目,m為集成大小。
然而,通過該查詢策略所獲得的信息量也許重復,這就導致了一些未標記樣本擁有同樣的信息量并且將被隨機挑出。這給分類性能的提高帶來了不利的影響。在本發明中,提供了一種基于主動學習的高光譜圖像分類方法用來處理這個問題。
發明內容
本發明的目的在于克服上述已有技術的不足,提出一種基于主動學習的高光譜圖像分類方法,旨在降低信息量的重復程度來獲得它們的一個更精確的排序,從而提高高光譜圖像的分類精度。
實現本發明目的的技術方案是:一種基于主動學習的高光譜圖像分類方法,其特征在于:包括如下步驟:
(1)對高光譜圖像的每一個樣本即像素,提取譜特征與空間特征,將這些特征融合為一個特征向量;
(2)將所有樣本隨機劃分為測試數據集與訓練數據集,訓練數據集被進一步隨機劃分為已標記數據集和未標記數據集;
(3)在已標記數據集上構造初始集成分類器;
(4)每一次迭代,根據新的信息量度量準則挑選出固定數目的最高信息量的未標記樣本用于人工標記;
(5)利用最終得到的集成分類器進行預測。
所述步驟1)是按以下步驟進行的:
(1a)利用主成分分析PCA算法提取高光譜圖像的譜特征,若干個主成分能夠包含圖像的大部分信息;
(1b)在每一個主成分的基礎上進行形態學開和閉運算,提取形態學特征;
(1c)將提取出來的譜特征和形態學特征融入一個特征向量,形成每一個樣本即像素的新特征。
所述步驟4)按如下過程進行:
4a)對每一個未標記樣本xu,按照新的信息量度量準則計算它的信息量:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于西安電子科技大學,未經西安電子科技大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201410066856.9/2.html,轉載請聲明來源鉆瓜專利網。





