[發明專利]一種基于K?means與深度學習的圖像分類算法在審
| 申請號: | 201611259889.0 | 申請日: | 2016-12-30 |
| 公開(公告)號: | CN106845528A | 公開(公告)日: | 2017-06-13 |
| 發明(設計)人: | 王改華;李濤;呂朦;袁國亮 | 申請(專利權)人: | 湖北工業大學 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62 |
| 代理公司: | 武漢開元知識產權代理有限公司42104 | 代理人: | 王和平,劉琳 |
| 地址: | 430068 湖*** | 國省代碼: | 湖北;42 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 means 深度 學習 圖像 分類 算法 | ||
技術領域
本發明屬于信息技術領域,具體的來說,是指一種基于K-means與深度學習的圖像分類算法,適用于互聯網中海量高維數據圖像的分類,還用于網絡圖像檢索、視頻檢索、遙感圖像分類、交互式游戲、智能機器人等領域的圖像數據分類。
背景技術
在海量圖像數據處理技術領域,深度學習是一種較為常見的算法。深度學習作為一種算法于2006年被Hinton提出,并得到了廣泛的認可與應用,其本質是通過建立具有多個隱層的人工神經網絡模型和大規模的訓練數據,來學習有用且抽象的特征,最終的結果是提升圖像分類的準確性。因此,深度學習能很好地解決海量圖像數據處理問題。Hinton提出DBN網絡,并證實了(1)深層網絡結構較淺層網絡結構具有更好的特征學習能力;(2)通過逐層訓練的方式使得深層網絡結構能得到很好地訓練。此后,有較多的深度學習模型相繼被提出,這些模型也印證了Hinton的觀點。
傳統神經網絡的訓練方法主要是采用反向傳播算法(BP)的方式,采用隨機初始化的方法,通過迭代的方式計算當前網絡的輸出,然后根據當前預測標簽和實際標簽之間的差去不斷調整前面各層之間的參數,直到整個模型收斂。傳統的BP算法作為一種有監督學習算法,存在著梯度彌散問題、訓練樣本不足以及局部最優等問題,與此同時,由于互聯網中海量無標簽圖像呈爆發式增長,傳統的BP算法已不能滿足日前海量無標簽圖像分類的需求。
發明內容
本發明的目的是針對傳統神經網絡的訓練方法存在著梯度彌散問題、訓練樣本不足以及局部最優的問題,提出一種基于K-means與深度學習的圖像分類算法。
為實現上述目的,本發明所設計的一種基于K-means與深度學習的圖像分類算法,包括如下步驟:
1)將無標簽圖像作為輸入圖像,并隨機抽取圖像塊構成大小相同的無標簽圖像集;
2)采用K-means算法提取一次最佳聚類中心;
3)構建特征映射函數,提取無標簽圖像集的圖像特征;
4)進行池化操作與歸一化處理;
5)采用K-means算法提取二次最佳聚類中心,并采用卷積操作,提取最終圖像特征,對最終圖像特征進行標準化處理;
6)通過分揀器對經過標準化處理的最終圖像特征進行分類。
優選地,所述步驟2)的具體步驟包括:
21)設定k個初始的聚類中心{μ1,μ2,μ3…μk},k為自然數,建立初始化的準則函數
其中,μj為每一個樣本x(i)對應的聚類中心,j=1~k,i為自然數,且i>j;x(i)表示n個無標簽圖像集中的樣本,n為自然數,表示無標簽圖像集中樣本的個數。
22)依次求取每一個樣本x(i)到所有初始的聚類中心{μ1,μ2,μ3…μk}的距離的最小值,記為該樣本的類別標簽c(i),將該樣本x(i)歸為c(i)類,再根據所述類別標簽c(i)更新計算聚類中心,得到過程聚類中心μj′,j=1~k;
c(i)=argmin||x(i)-μj′||
23)將所有所述過程聚類中心μj′帶入準則函數計算,判斷準則函數是否收斂,否則返回步驟22),是則將至步驟24);
24)將過程聚類中心μj′確定為一次最佳聚類中心{μ′1,μ′2,μ′3…μ′k},將每一個樣本x(i)歸類至距離最近的聚類中心,記為xj(i),每一個樣本x(i)到距離最近的聚類中心的類別標簽記為cj(i)。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于湖北工業大學,未經湖北工業大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201611259889.0/2.html,轉載請聲明來源鉆瓜專利網。





