[發明專利]一種基于超級像素層次特征的圖像像素標號方法在審
| 申請號: | 201310568087.8 | 申請日: | 2013-11-14 |
| 公開(公告)號: | CN104637045A | 公開(公告)日: | 2015-05-20 |
| 發明(設計)人: | 董世都 | 申請(專利權)人: | 重慶理工大學 |
| 主分類號: | G06T7/00 | 分類號: | G06T7/00 |
| 代理公司: | 無 | 代理人: | 無 |
| 地址: | 400054 *** | 國省代碼: | 重慶;85 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 超級 像素 層次 特征 圖像 標號 方法 | ||
技術領域
本發明涉及對圖像的每一個像素所屬物體類別進行標號,能在同一過程中實現物體的檢測、分割及識別,是圖像場景理解的基礎。
背景技術
目前像素標號技術主要采用條件隨機場(CRF)模型對圖像中的每一個像素逐一進行標號。每個像素的標號用一個隨機變量表示。其聯合概率分布由一元勢函數(簡稱一元項)及二元勢函數(簡稱二元項)決定。每個像素的一元項通常由像素分類器輸出的像素標號的概率決定。由于分類器的計算量通常較大,圖像像素個數又較多,因而為每像素計算一元項非常耗時。二元項通常由兩相鄰像素的色彩差異決定。求解條件隨機場模型通常采用Y.?Boykov提出的α-expansion?或αβ-swap方法,該方法需要多次計算以每個像素為頂點的所構成圖的最大流(或最小切),若像素太多,也非常耗時。?
為了解決該問題,?B.?Fulkerson等提出用過分割技術把像素聚集成為超級像素。由于超級像素通常由上百個像素構成,其數量遠小于像素個數,因而計算一元項及求解條件隨機場模型所需要的時間大大減少。但是由于該方法采用了非線性的SVM計算一元項,由于非線核函數的計算量較大,標號的速度依然較慢。另外,由于該方法僅采用直方圖綜合相鄰的超級像素構成單層區域的特征作為超級像素的特征,因而標號精度也有待提高。
發明內容
為了克服上述現有技術的不足,提高像素標號的精度與速度,本發明提供了一種基于超極像素層次特征的像素標號方法。
本發明所采用的技術方案是:?首先用已經標號的訓練集圖像,通過訓練模塊對標號過程所需的特征編碼器、線性SVM及條件隨機場的參數進行訓練,然后用標號模塊對未知圖像進行標號。
所述訓練模塊的步驟如下:
(1)提取訓練集圖像的每個像素的特征(如SIFT特征、HOG特征或Texton特征等)。并用這些特征訓練特征編碼器(如K均值聚類或稀疏編碼等)獲得字典。然后用編碼器編碼每個特征。
設xi為第i個像素,D?=?[d1,?d2,...,?dk]為訓練得到的字典,f(xi)為編碼器,則第i個像素的編碼為:
?
(2)?訓練集圖像通過分割(如quick-shift或watershed等),獲得到超級像素圖像。
(3)?計算超級像素層次特征:以圖像的每個超級像素為中心,按不同距離合并相鄰的超級像素,得到層次不同的鄰域區域;或利用圖像層次分割技術(如P.?Arbelaez提出的層次分割法等),得到超級像素層次結構。用Max-pooling計算各區域的特征,連接各層特征,得到超級像素的層次特征。
設?為第i個超級像素的區域,?表示與第i個超級像素距離等于k的超級像素組成的區域,即:
其中表示第i個超級像與第j個超級像之間的距離。距離可用超級像素的相鄰關系來度量(相鄰超級像素的距離定義為1)或用兩超級像素之間的色彩或紋理的相似性來度量。
用Max-Pooling綜合區域?所有像素的特征,得到該層的特征。?的第j個分量為:
連接超級像素i的各層區域的特征,得到層次特征,
(4)?訓練線性SVM:通過步驟(3)計算訓練集圖像的超級像素層次特征。訓練集圖像中超級像素的標號為其對應區域中所有的像素標號中出現次數最多的一個標號(訓練集圖像中的每個像素已事先標號)。利用超級像素層次特征以及對應的標號訓練非線性SVM分類器。
設Fi為第i像素的層次特征,則其標號可由下式計算獲得
其中Y為物體類別的集合,?為類別l的分類器參數,其值用訓練集中超級像素層次特征以及對應的標號通過下式求解(即訓練)獲得,
,
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于重慶理工大學;,未經重慶理工大學;許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201310568087.8/2.html,轉載請聲明來源鉆瓜專利網。





