[發明專利]一種基于無監督特征學習的圖像分類方法在審
| 申請號: | 202010173425.8 | 申請日: | 2020-03-12 |
| 公開(公告)號: | CN111401434A | 公開(公告)日: | 2020-07-10 |
| 發明(設計)人: | 聶飛平;陸繼韜;王榕;李學龍 | 申請(專利權)人: | 西北工業大學 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62;G06K9/34 |
| 代理公司: | 西北工業大學專利中心 61204 | 代理人: | 常威威 |
| 地址: | 710072 *** | 國省代碼: | 陜西;61 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 監督 特征 學習 圖像 分類 方法 | ||
1.一種基于無監督特征學習的圖像分類方法,其特征在于步驟如下:
步驟1:對于原始第i幅輸入圖像,i=1,2,…,N,N為輸入圖像的數量,按照以下過程提取得到其降維后特征圖集合其中,表示原始第i幅輸入圖像的第j幅降維后的特征圖,j=1,2,…,D1,D1為設定的目標維度:
步驟1.1:以步長為1的滑動窗口提取圖像中以每個像素為中心的圖像塊,然后,將每個圖像塊拉伸為一維向量,并分別對每個向量進行去均值化處理,以每個去均值化后的向量作為矩陣的一列,得到矩陣X;其中,設輸入圖像的大小為p×p,所述的圖像塊的大小為k×k,k的取值范圍為1<k<p;
步驟1.2:采用主成分分析算法求解一組標準正交基構成的正交矩陣V,滿足:
其中,L1為設定的濾波器個數,取值范圍為1≤L1<k2;
將矩陣V的每一列由向量變換為k×k大小的矩陣,以變換得到的每個矩陣為一個濾波器,再將每個濾波器分別與原始輸入圖像做卷積運算,且通過補零操作使卷積后得到的特征圖與原始圖像大小相同,得到L1幅大小為p×p的特征圖;
步驟1.3:將步驟1.2輸出的每幅特征圖拉伸為一個一維向量,并以其作為矩陣的一行,得到原始特征圖矩陣再采用主成分分析算法求解一組標準正交基構成的投影矩陣U1,滿足:
其中,D1為設定的目標維度,取值范圍為1≤D1≤L1;
按照計算得到降維后矩陣P,將P的每一個行向量變換為p×p大小的矩陣,每個矩陣即為一幅降維后的特征圖,共得到D1幅降維后的特征圖,構成原始輸入圖像降維后的特征圖集合;
步驟2:對于步驟1得到的每一個降維后特征圖集合以其中的每一幅圖像為輸入圖像,j=1,2,…,D1,并令步驟1.2中所述的濾波器個數為L2,取值范圍為1≤L2<k2,步驟1.3中所述的目標維度為D2,取值范圍為1≤D2≤L2,按照步驟1計算得到第二次降維后特征圖集合
步驟3:對于步驟2得到的每一個特征圖集合將其中的所有圖像都進行二值化處理,使圖像中所有的像素值為0或1,然后,提取不同圖像中同一位置的所有像素點值構成一個長度為D2的二進制串,對所有位置的像素點都如此進行提取,再將每一個二進制串轉換為一個十進制數,并以每個十進制數作為其對應的二進制串所提取像素位置的新的像素值,得到一幅新圖像,記為
至此,對于原始第i幅輸入圖像,得到一個新圖像集合
步驟4:對于步驟3得到原始第i幅輸入圖像的新圖像集合Γi,i=1,2,…,N,將其中的每一幅圖像以步長為s、大小為b×b的滑動窗口進行區塊提取,其中,1≤b≤p,1≤s≤b,然后,分別在每個區塊中統計含有個bin的直方圖,再將所有直方圖連接成一個向量;將集合中所有圖像按前述過程得到的向量相連接,并以連接后的向量作為原始第i幅輸入圖像的特征嵌入;
對原始每一幅輸入圖像的新圖像集合Γi,i=1,2,…,N,都按照上述過程進行處理,得到其對應的特征嵌入,得到全部原始N幅輸入圖像的N個特征嵌入;
步驟5:以步驟4得到的N個特征嵌入作為分類器的輸入數據,原始N幅輸入圖像的標簽作為分類器的輸入標簽,對分類器進行訓練,得到訓練好的分類器;所述的分類器包括最鄰近分類器、支持向量機;
步驟6:以未標記的待分類M幅圖像為輸入圖像,按照步驟1-4計算得到其M個特征嵌入,再將這M個特征嵌入輸入到步驟5得到的訓練好的分類器,得到分類結果。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于西北工業大學,未經西北工業大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010173425.8/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:應用于顯示設備的內容展示方法、裝置和電子設備
- 下一篇:一種吊頂定位裝置





