[發明專利]一種基于CNN和VLAD的煤巖識別方法在審
| 申請號: | 201810748171.0 | 申請日: | 2018-07-10 |
| 公開(公告)號: | CN108596163A | 公開(公告)日: | 2018-09-28 |
| 發明(設計)人: | 劉曉陽;呂紅杰 | 申請(專利權)人: | 中國礦業大學(北京) |
| 主分類號: | G06K9/00 | 分類號: | G06K9/00;G06K9/62;G06N3/04 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 100083 *** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 圖像特征 煤巖 煤巖識別 預處理 圖像 卷積神經網絡 支持向量機 高層特征 視覺詞典 提取圖像 圖像表示 因素影響 初始化 分類器 列向量 魯棒性 識別率 識別器 殘差 構建 聚類 聚合 噪聲 光照 采集 | ||
1.一種基于CNN和VLAD的煤巖識別方法,其特征在于,包括以下步驟:
A.在樣本的訓練階段,分別采集煤樣本圖像和巖樣本圖像若干張,其中煤樣本圖像和巖樣本圖像各占一半,分別取2/3煤樣本圖像和2/3巖樣本圖像作為訓練樣本集,剩下的圖像作為測試樣本集;
B.對樣本訓練集中的煤樣本圖像和巖樣本圖像進行特征提取,步驟如下:
(1)將訓練集中的樣本圖像輸入到經過預訓練的AlexNet深度卷積神經網絡中,對每幅樣本圖像提取網絡第5層256個大小為13×13的特征圖;
(2)對256個特征圖,每幅樣本圖像中相同位置的特征值順序排列為一個256維的特征向量,構成13×13個特征向量;
(3)以C種不同的初始化方法對所述256維的特征向量進行聚類運算,所述聚類運算中,給定簇的數量為k,其中C=1,2,3…;
(4)把每個特征向量分配給距離它最近的簇中心,得到C組不同的聚類形式,每組包含k個簇;
(5)計算每個簇中所有特征向量與簇中心的殘差和,以各所述殘差和為元素,C種初始化方法分別得到一個VLAD特征向量表示;
(6)對所述的VLAD特征向量表示進行符號方根和歸一化處理,進一步將C組不同的VLAD特征平整化為一個特征向量;
(7)對步驟(6)中得到的特征向量進行降維和白化處理,得到降維后的特征向量;
C.將降維后的特征向量輸入支持向量機,進行分類器的訓練;
D.將測試集樣本中的煤樣本圖像和巖樣本圖像按照步驟A和步驟B的方法進行特征向量的提取,然后輸入由步驟C得到的訓練好的分類器,測試煤巖圖像的識別精度;
E.對于待識別煤巖圖像,經過圖像預處理,提取根據步驟B得到的圖像特征向量輸入根據步驟C得到的訓練好的分類器中,根據分類器輸出結果判別煤巖類型。
2.根據權利要求1所述的基于CNN和VLAD的煤巖識別方法,其特征在于,所述的經過預訓練的AlexNet深度卷積神經網絡是在ILSVR2012數據集上訓練好的深度網絡模型,包含5個卷積層和3個全連接層,在本發明中,舍棄了AlexNet網絡后三層全連接層,剩下的5個卷積層直接作為特征提取器進行煤巖圖像的特征提取。
3.根據權利要求1所述的基于CNN和VLAD的煤巖識別方法,其特征在于,步驟(3)中,C種不同的初始化方法為隨機初始化,同時采用K-means聚類運算。
4.根據權利要求1所述的基于CNN和VLAD的煤巖識別方法,其特征在于,步驟(4)中,簇的集合表示為Sc,m,即
Sc,m={fi,j|m=argminp‖fi,j-μc,p‖}
表示把每個特征向量分配到距離它最近的簇中心的集合,其中,fi,j表示特征圖中第i行第j列的特征點對應的256維特征向量,1≤i≤13,1≤j≤13,m表示簇中心,m={1,2,…k},μc,p表示第c種初始化聚類方法中,第p簇的簇中心對應的特征向量,c={1,2,…C},‖·‖為L2范數,用于計算特征向量fi,j與簇中心μc,p之間的距離。
5.根據權利要求1所述的基于CNN和VLAD的煤巖識別方法,其特征在于,步驟(5)中,殘差和的計算方法為:
其中,vc,m表示殘差和;fi,j表示特征圖中第i行第j列的特征點對應的256維特征向量;Sc,m表示第c種初始化聚類方法中,第m簇的集合;μc,m表示第c種初始化聚類方法中,第m簇的簇中心對應的特征向量。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國礦業大學(北京),未經中國礦業大學(北京)許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810748171.0/1.html,轉載請聲明來源鉆瓜專利網。





