[發明專利]一種基于分布式K-means的海量圖像分類方法有效
| 申請號: | 201510363396.0 | 申請日: | 2015-06-26 |
| 公開(公告)號: | CN104933445B | 公開(公告)日: | 2019-05-14 |
| 發明(設計)人: | 董樂;張寧 | 申請(專利權)人: | 電子科技大學 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62 |
| 代理公司: | 電子科技大學專利中心 51203 | 代理人: | 李明光 |
| 地址: | 611731 四川省成*** | 國省代碼: | 四川;51 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 分布式 means 海量 圖像 分類 方法 | ||
1.一種基于分布式K-means的海量圖像分類方法,具體包括如下步驟:
步驟1.訓練圖像預處理;
輸入訓練圖像數據集,并將每張訓練圖像劃分成多個圖像塊,對每個圖像塊依次進行正則化和白化操作以去除干擾信息、保留關鍵信息,作為輸入信息送給下一步處理;
步驟2.在大數據處理平臺Hadoop上,將K-means算法并行化,把步驟1所得的預處理后的圖像塊信息作為輸入,進行字典的提??;
步驟2所述的字典提取過程具體如下:
經過步驟1預處理后的圖像塊作為Map節點的輸入,首先初始化聚類中心,多個Map節點并行的讀取預處理后的圖像數據,并計算分配到每個聚類中心的元素,之后在Reduce節點上,統計每個類別的所有元素,重新計算新的聚類中心,對比新的聚類中心和之前的聚類中心的變化是否小于設定的閾值,若小于,則迭代結束,輸出聚類中心,否則更新聚類中心,重新開始新的一輪迭代過程;
步驟3.提取字典后,構建特征映射函數,將預處理后的訓練圖像塊映射為新的特征表達;
步驟3具體過程如下:
將步驟2得到的字典并行化的分配給多個Map節點,同時輸入新的無標簽的圖像數據集給每個Map節點,對Map節點上的圖像數據集進行特征學習,將輸入圖像數據進行特征映射得到的特征,公式如下:
其中,f(i)(x)是圖像塊的新的特征表達,N是步驟2所提取字典的聚類中心總數,c(k)是第k個聚類中心;
步驟4.將步驟3獲得的訓練圖像塊的新的特征表達輸入到SVM分類器中,進行圖像分類訓練;
步驟5.針對需要進行分類的目標圖像,將其依次進行圖像塊劃分、正則化、白化操作以及特征提取之后,利用完成圖像分類訓練的SVM分類器進行分類。
2.根據權利要求1所述的基于分布式K-means的海量圖像分類方法,其特征在于,步驟1所述的正則化操作具體如下:
其中x(i)是輸入的第i個圖像塊,為正則化后的第i個圖像塊,var(x(i))和mean(x(i))分別是x(i)中所有元素的方差和平均值;σ是一個預設常量,其作用是在進行除法之前的操作,減少了噪音以及防止方差趨近于零的時候,防止除數為零。
3.根據權利要求1所述的基于分布式K-means的海量圖像分類方法,其特征在于,采用PCA白化方法對正則化的每個圖像塊進行減少像素間相關性的處理:
其中,λ(i)和U(i)分別是正則化的圖像塊的特征值和特征向量,式(2)的作用是減少輸入圖片的像素之間相關性,通過公式(3)得到了白化后的圖像塊數據,ε為預設常數。
4.根據權利要求1所述的基于分布式K-means的海量圖像分類方法,其特征在于,步驟4及步驟5采用DAG-SVM分類器進行最后的訓練及分類過程。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于電子科技大學,未經電子科技大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201510363396.0/1.html,轉載請聲明來源鉆瓜專利網。





