[發明專利]一種基于深度學習的紋身圖像分類方法有效
| 申請號: | 201410138343.4 | 申請日: | 2014-04-08 |
| 公開(公告)號: | CN103996056B | 公開(公告)日: | 2017-05-24 |
| 發明(設計)人: | 張永良;肖健偉;高思斌;肖剛 | 申請(專利權)人: | 浙江工業大學 |
| 主分類號: | G06K9/66 | 分類號: | G06K9/66 |
| 代理公司: | 杭州斯可睿專利事務所有限公司33241 | 代理人: | 王利強 |
| 地址: | 310014 浙江省*** | 國省代碼: | 浙江;33 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 深度 學習 紋身 圖像 分類 方法 | ||
1.一種基于深度學習的紋身圖像分類方法,其特征在于:所述分類方法包括以下步驟:
1)樣本變換
1.1)仿射變換;
1.2)彈性變換:對樣本進行曲面模擬,過程如下:
對n*m的圖像進行變換,得到n*m個向量構成坐標矩陣X;
其中Y=[y1,y2,…,ym],1≤i≤n,列向量表示圖中橫坐標第i位置,縱坐標第j位置,1≤j≤m,將其輸入到輸入維度為2,輸出維度為1的神經網絡中,采用3層神經網絡,變換函數為:
P=g(W2g(W1(X+b1))+b2) (2)
其中:
P=[p1,1,p1,2,…,p1,m,p2,1,p2,2,…,p2,m,…,pn,1,pn,2,…,pn,m]
pi,j為向量對應的輸出值;
g為神經網絡的激活函數,選用sigmoid函數即x為函數的輸入值;
W1,W2,b1,b2是(-r,r)均勻分布的隨機數;
對于神經網絡隨機初始化的范圍為(-r,r)即構成所需要的曲面模型,滿足光滑,并且由參數控制形變復雜度的特性;
得到曲面后,對曲面上毎一點求導得到偏移矩陣G,得到每個像素點最后的偏移坐標:
Xo=X+G (3)
最后把新圖像中點X的像素值取原圖像Xo經過線性插值后的像素值;
1.3)遮擋模擬:在每幅輸入訓練機的圖像隨機把某一區域的像素值置0;
1.4)白化;
2)自編碼預訓練:使用CUDA優化后的自編碼訓練機對大量彩色紋身圖像進行訓練,得到紋身圖像的一些共同地邊緣信息,同時對這些圖像做些挑選后用于卷積網絡的第一層;
3)卷積網絡訓練:使用CUDA優化后的卷積網絡對有標定的紋身圖像進行訓練得到最終分類結果。
2.如權利要求1所述的一種基于深度學習的紋身圖像分類方法,其特征在于:所述分類方法還包括以下步驟:
4)對卷積網絡優化:使用了隨機池化和對于隨機池化的BP算法,使用CUDA對整體流程進行優化。
3.如權利要求2所述的一種基于深度學習的紋身圖像分類方法,其特征在于:所述分類方法還包括以下步驟:
5)使用holdout驗證控制樣本變換程度。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于浙江工業大學,未經浙江工業大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201410138343.4/1.html,轉載請聲明來源鉆瓜專利網。





