[發明專利]一種遙感場景分類方法在審
| 申請號: | 201710147637.7 | 申請日: | 2017-03-13 |
| 公開(公告)號: | CN106991382A | 公開(公告)日: | 2017-07-28 |
| 發明(設計)人: | 劉青山;杭仁龍;葛玲玲;宋慧慧;孫玉寶 | 申請(專利權)人: | 南京信息工程大學 |
| 主分類號: | G06K9/00 | 分類號: | G06K9/00;G06K9/46;G06K9/62;G06N3/08;G06T3/40 |
| 代理公司: | 江蘇愛信律師事務所32241 | 代理人: | 唐小紅 |
| 地址: | 210044 *** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 遙感 場景 分類 方法 | ||
技術領域
本發明屬于圖像信息處理技術領域,涉及一種遙感場景分類方法。
背景技術
隨著遙感技術的發展,從衛星和飛機上獲取大量的高分辨率地球觀測圖像。與其他圖像不同的是,遙感場景表現出一些特殊的特征。例如,在一個場景中有各種不同大小、顏色和方向。在土地資源管理和城市規劃等各種應用中,遙感場景分類是一項基礎性工作,更是一個重要的研究課題。自動準確地解釋如此龐大的圖像庫的已成為一個迫切的需求。
在過去的幾年中,大量的特征表示模型已經提出了運用于場景分類。最常用的模型之一是視覺詞袋,一般包括以下三個步驟:1)提取圖像的底層視覺特征,如尺度不變特征變換(SIFT)和方向梯度直方圖(HOG)的描述;2)通過使用k-均值或其他方法聚類特征形成視覺詞匯;3)視覺特征映射到最接近的單詞,通過單詞直方圖產生一個中級的特征表示。該模型及其變種在遙感領域已被廣泛研究。
盡管視覺詞袋在遙感場景分類是有一定的有效性,但是它提供了一個無序的局部描述符集合且沒有考慮空間信息。為了克服這一缺點,空間金字塔匹配模型應運而生。該模型首先將原始圖像分割成不同級別的分辨率。其次,對于每個級別的分辨率,從每個空間中提取局部特征的直方圖。最后,空間直方圖由加權金字塔匹配內核表示。由于遙感影像通常不存在絕對參照系,所以圖像要素的相對空間排列變得十分重要。因此,提出了用空間金字塔共生模型表征圖像的光度和幾何信息。不同于將圖像分割成統一的細胞,空間金字塔共生模型是用隨機空間分割來描述各種圖像布局的。
所有上述方法都是基于手工提取特征的,這很大程度上依賴于專家的經驗和領域知識。此外,這些特征很難在鑒別力和魯棒性之間取得最佳平衡。這主要是由于沒有考慮真實數據的細節。深度學習算法,尤其是卷積神經網絡,在解決這個問題上已經顯示出巨大的潛力,因為可以從原始圖像層次化的方式中自動學習高層次的語義特征,這在遙感社區已引起越來越多的關注。
然而,很難直接在遙感場景圖像分類上運用卷積神經網絡,因為往往要訓練數以百萬計的參數,而可用的訓練集數量卻很少。許多相關研究表明,從卷積神經網絡中提取的特征是可以作為通用描述符。因此,從大規模的標注數據如ImageNet,運用神經網絡學習出的圖像表示,可以有效地被轉移到一個帶有限數量訓練數據的廣泛視覺識別任務中。出于這種想法,相關研究驗證了使用ImageNet預訓練的卷積神經網絡進行遙感場景分類的可行性。采用預訓練的卷積神經網絡并微調遙感場景數據,分類性能令人印象深刻。目前,已有對于從卷積神經網絡全連接層提取特征的泛化能力在遙感場景分類上的評估,并顯示在公共遙感場景數據集上的最新結果。
雖然遷移學習能夠緩解過度擬合的問題,但在基于卷積神經網絡的遙感場景分類上還存在一些問題。第一,大部分的卷積神經網絡只利用最后的全連接層作為后續的分類特征。直接丟棄前面卷積層的特征這是不合理的,因為這些可能是對分類目標有益的。事實上,從卷積層提取的特征比那些從連接層提取的特征更通用,因此這些特征可能更適合于遷移學習。此外,和激活全連接層相比,從卷積層提取的特征包含更多的空間信息,有利于圖像分類。最近已有人認識到卷積層的特征的重要性,但他們只使用最后一個卷積層,忽略其他卷積層。
還有一個值得注意的問題,感興趣的對象通常在不同的遙感場景有不同的尺度,甚至一個場景可能包含不同大小的對象。然而,最流行的卷積神經網絡需要一個固定大小的輸入圖像(例如,227×227像素)。常見的解決方案是將原始遙感圖像變形或固定成預先定義的大小,這不可避免地會導致有效的判別信息的丟失。
受空間金字塔模型啟發,我們考慮所有卷積層的特征作為輸入圖像的多分辨率表示。然后,金字塔匹配內核被用來集成一個統一的表示。不同于空間金字塔模型,我們用低級別的描述符作為深度特征,從數據本身去學習出不同的卷積層之間最優融合權重,而不是預先定義。減少了固定的輸入圖像尺寸造成的信息損失,而且多尺度圖像送入卷積神經網絡可以從不同尺度學習出更多補充信息。考慮到學習多尺度深度特征的計算成本,我們選擇帶有空間金字塔池化的卷積神經網絡作為我們的基本的深度網絡。在全連接網絡之前增加一個空間金字塔池化層,允許輸入圖像是任意大小的。因此,一個訓練好的空間金字塔池化網絡可以從多尺度輸入圖像中提取多尺度特征,從而有利于遙感場景的分類。
發明內容
本發明所要解決的技術問題在于克服現有技術不足,提供一種遙感場景分類方法,充分利用了多尺度深度特征提取和自適應深度金字塔匹配模型的優點,能夠更好地對遙感場景進行分類,具有較好的分類性能和分類準確率。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于南京信息工程大學,未經南京信息工程大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710147637.7/2.html,轉載請聲明來源鉆瓜專利網。





