[發(fā)明專利]基于神經(jīng)主題模型的圖像集成分類方法及裝置有效
| 申請?zhí)枺?/td> | 201711242374.4 | 申請日: | 2017-11-30 |
| 公開(公告)號: | CN108154156B | 公開(公告)日: | 2021-11-12 |
| 發(fā)明(設計)人: | 李曉旭;耿丙乾;常東良;喻梨耘 | 申請(專利權)人: | 蘭州理工大學 |
| 主分類號: | G06K9/46 | 分類號: | G06K9/46;G06K9/62;G06N3/04;G06N3/08 |
| 代理公司: | 中科專利商標代理有限責任公司 11021 | 代理人: | 任巖 |
| 地址: | 730050 甘肅*** | 國省代碼: | 甘肅;62 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 神經(jīng) 主題 模型 圖像 集成 分類 方法 裝置 | ||
1.一種基于神經(jīng)主題模型的圖像集成分類方法,包括以下步驟:
S1,對圖像進行預處理,提取圖像的詞袋特征v和深度卷積神經(jīng)網(wǎng)絡特征vCNN,其中,所述圖像包括訓練集和測試集;
S11,輸入圖像和類標信息;
S12,對圖像進行特征檢測,提取SIFT特征向量特征,即詞袋特征;
S13,利用訓練后的卷積神經(jīng)網(wǎng)絡,提取深度卷積神經(jīng)網(wǎng)絡特征;
S2,在神經(jīng)主題模型中引入所述深度卷積神經(jīng)網(wǎng)絡特征vCNN,并結合集成分類方法softmax混合模型,構建圖像集成分類的神經(jīng)主題模型;
其中,將提取的SIFT詞袋特征v=[v1,v2,...,vD]和Deep-CNN特征vCNN作為網(wǎng)絡的輸入層,詞袋特征v和類標y為網(wǎng)絡輸出層,結合集成分類方法softmax混合模型,將訓練集圖像和類標的聯(lián)合概率建模為:
其中,
xl>0,
p(yl|v,vCNN)=softmax(d+Ulh(vCNN,v));
p(vi=t|vCNN,v<i)使用前饋神經(jīng)網(wǎng)絡結構建模,
式中,v表示詞袋特征,y表示類標,L表示分類器的總數(shù),xl表示第l個Softmax的權重,yl表示圖像在第l個分類器的預測值,D表示圖像的詞袋特征所包括的詞的個數(shù),vi表示圖像中的第i個詞v<i表示圖像中在第i個詞之前的詞,即第1個到i-1個詞;d、U表示參數(shù),h()表示函數(shù),v表示圖像中任意一個詞;g()表示sigmoid函數(shù),c、T表示參數(shù),表示參數(shù)矩陣;a表示softmax函數(shù)的輸入,j表示任意一類別,C表示j的最大值;b、V表示參數(shù),t、t’表示字典中詞的序號;i、k表示圖像中詞的序號;
S3,基于訓練集優(yōu)化所述圖像集成分類的神經(jīng)主題模型的目標函數(shù),并求解模型參數(shù);
S4,利用優(yōu)化后的圖像集成分類的神經(jīng)主題模型對測試集圖像進行分類。
2.根據(jù)權利要求1所述的基于神經(jīng)主題模型的圖像集成分類方法,其中,在所述步驟S12中,提取SIFT特征向量特征后使用K-means聚類形成碼書,并將圖像用碼詞詞頻表示。
3.根據(jù)權利要求1所述的基于神經(jīng)主題模型的圖像集成分類方法,其中,在所述步驟S13中,在ImageNet數(shù)據(jù)集上訓練卷積神經(jīng)網(wǎng)絡VGG19,利用訓練后的卷積神經(jīng)網(wǎng)絡VGG19,提取實驗數(shù)據(jù)集上VGG19網(wǎng)絡的倒數(shù)第二個全連接層特征,即深度卷積神經(jīng)網(wǎng)絡特征vCNN。
4.根據(jù)權利要求1所述的基于神經(jīng)主題模型的圖像集成分類方法,其中,在步驟S3中,所述目標函數(shù)為vn表示訓練集中第n幅圖像的詞袋特征,yn表示第n幅圖像的類標,N為n的最大值。
5.根據(jù)權利要求4所述的基于神經(jīng)主題模型的圖像集成分類方法,其中,通過隨機梯度下降法求解模型參數(shù)。
6.根據(jù)權利要求1所述的基于神經(jīng)主題模型的圖像集成分類方法,其中,所述步驟S4包括以下子步驟:
S41,輸入待分類圖像的SIFT特征向量特征和Deep-CNN特征;
S42,將數(shù)據(jù)輸入訓練后的圖像集成分類的神經(jīng)主題模型,通過比較多個分類規(guī)則結果,尋找最大的預測值來得到類標,公式如下:
其中,xl表示第l個softmax的權重,p(yl|vCNN,v)表示第l個softmax輸出的概率;
S43,輸出經(jīng)分類后的圖像的類標。
7.一種基于神經(jīng)主題模型的圖像集成分類裝置,包括:
預處理模塊,用于對圖像進行預處理,提取圖像的詞袋特征v和深度卷積神經(jīng)網(wǎng)絡特征vCNN,其中,所述圖像包括訓練集和測試集;
處理模塊,用于在神經(jīng)主題模型中引入所述深度卷積神經(jīng)網(wǎng)絡特征vCNN,并結合集成分類方法softmax混合模型,構建圖像集成分類的神經(jīng)主題模型;
其中,將提取的SIFT詞袋特征v=[v1,v2,...,vD]和Deep-CNN特征vCNN作為網(wǎng)絡的輸入層,詞袋特征v和類標y為網(wǎng)絡輸出層,結合集成分類方法softmax混合模型,將訓練集圖像和類標的聯(lián)合概率建模為:
其中,
xl>0,
p(yl|v,vCNN)=softmax(d+Ulh(vCNN,v));
p(vi=t|vCNN,v<i)使用前饋神經(jīng)網(wǎng)絡結構建模,
式中,v表示詞袋特征,y表示類標,L表示分類器的總數(shù),xl表示第l個Softmax的權重,yl表示圖像在第l個分類器的預測值,D表示圖像的詞袋特征所包括的詞的個數(shù),vi表示圖像中的第i個詞v<i表示圖像中在第i個詞之前的詞,即第1個到i-1個詞;d、U表示參數(shù),h()表示函數(shù),v表示圖像中任意一個詞;g()表示sigmoid函數(shù),c、T表示參數(shù),表示參數(shù)矩陣;a表示softmax函數(shù)的輸入,j表示任意一類別,C表示j的最大值;b、V表示參數(shù),t、t’表示字典中詞的序號;i、k表示圖像中詞的序號;
計算模塊,用于基于訓練集優(yōu)化所述圖像集成分類的神經(jīng)主題模型的目標函數(shù)求解模型參數(shù);以及
分類模塊,用于利用優(yōu)化后的圖像集成分類的神經(jīng)主題模型對測試集圖像進行分類。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于蘭州理工大學,未經(jīng)蘭州理工大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201711242374.4/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 用于治療支氣管樹的系統(tǒng)、組件和方法
- 一種頸部神經(jīng)信號記錄方法
- 用于在激活褐色脂肪組織時抑制神經(jīng)的方法和裝置
- 一種神經(jīng)元硬件裝置及用這種裝置模擬脈沖神經(jīng)網(wǎng)絡的方法
- 神經(jīng)移植物及應用其的神經(jīng)移植物系統(tǒng)
- 一種神經(jīng)疏通緩解裝置
- 神經(jīng)移植物及應用其的神經(jīng)移植物系統(tǒng)
- 一種模擬神經(jīng)網(wǎng)芯片的設計方法及模擬神經(jīng)網(wǎng)芯片
- 神經(jīng)網(wǎng)絡的剪枝方法、裝置、設備及存儲介質(zhì)
- 一套無人機神經(jīng)網(wǎng)絡控制用的人工神經(jīng)元模型





