[發(fā)明專利]一種基于選擇性稀疏采樣的細(xì)粒度圖像分類方法有效
| 申請?zhí)枺?/td> | 201910942790.8 | 申請日: | 2019-09-30 |
| 公開(公告)號: | CN110738247B | 公開(公告)日: | 2020-08-25 |
| 發(fā)明(設(shè)計(jì))人: | 焦建彬;丁瑤;葉齊祥;韓振軍;萬方 | 申請(專利權(quán))人: | 中國科學(xué)院大學(xué) |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62 |
| 代理公司: | 北京康思博達(dá)知識產(chǎn)權(quán)代理事務(wù)所(普通合伙) 11426 | 代理人: | 孫建玲;劉冬梅 |
| 地址: | 100049 *** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 選擇性 稀疏 采樣 細(xì)粒度 圖像 分類 方法 | ||
1.一種基于選擇性稀疏采樣的細(xì)粒度圖像分類方法,該方法包括訓(xùn)練分類模型用以進(jìn)行目標(biāo)分類的過程,分類模型的訓(xùn)練過程包括以下步驟:
步驟1:關(guān)鍵部件定位:將圖像輸入到一個分類網(wǎng)絡(luò)中,輸出其對應(yīng)的類響應(yīng)圖,在類響應(yīng)圖上提取類峰值響應(yīng);
步驟2:類峰值響應(yīng)分組:對步驟1中得到的類峰值響應(yīng)依據(jù)響應(yīng)強(qiáng)度進(jìn)行分組,分別為判別性注意力組和互補(bǔ)性注意力組,每個類峰值響應(yīng)生成一個注意力圖,相應(yīng)的兩組類峰值響應(yīng)生成兩組注意力圖;
步驟2包括以下子步驟:
步驟2.1:將步驟1中類峰值響應(yīng)劃分到兩個集合Td和Tc,劃分方式如下:
Td={(x,y)|(x,y)∈T if Rx,y≥ζ},
Tc={(x,y)|(x,y)∈T if Rx,y<ζ},
其中,Rx,y為(x,y)的響應(yīng)值,ζ為劃分?jǐn)?shù)值,Td為判別性類峰值響應(yīng)集合,Tc為互補(bǔ)性類峰值響應(yīng)集合,T為類峰值響應(yīng)位置集合,(x,y)為類峰值響應(yīng)的位置;
步驟2.2:利用高斯核函數(shù),對每一個類峰值響應(yīng)計(jì)算對應(yīng)的注意力圖,計(jì)算方式為:
其中,為(xi,yi)的響應(yīng)值,β1和β2為可學(xué)習(xí)的參數(shù),用于控制局部放大的程度;
步驟3:重采樣:將兩組中的注意力圖分別進(jìn)行聚合生成兩個顯著性圖,在顯著性圖的指導(dǎo)下對圖像進(jìn)行重采樣,實(shí)現(xiàn)對應(yīng)關(guān)鍵部件的局部放大,得到兩幅重采樣的圖像;
步驟4:將步驟3中得到的重采樣圖像輸入到步驟1中的分類網(wǎng)絡(luò)中提取特征,將原始圖像以及重采樣圖像的特征結(jié)合,利用分類器進(jìn)行分類,得到分類模型。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,步驟1中,該類峰值響應(yīng)為類響應(yīng)圖上的局部極大值。
3.根據(jù)權(quán)利要求1所述的方法,其特征在于,步驟1中,圖片只給定圖像標(biāo)號,不標(biāo)注目標(biāo)整體以及各部件的位置。
4.根據(jù)權(quán)利要求1所述的方法,其特征在于,步驟1包括以下子步驟:
步驟1.1:將圖像輸入到分類網(wǎng)絡(luò)中,計(jì)算類響應(yīng)圖,類響應(yīng)圖定義如下:
其中,Wfc是全連接層即分類器的權(quán)重,每一個類別c和每一張?zhí)卣鲌DSd對應(yīng)Wfc中的一個數(shù)值D為特征通道數(shù),d為特征圖S的其中一個通道標(biāo)號;
步驟1.2:利用步驟1.1中分類網(wǎng)絡(luò)得到分類結(jié)果,計(jì)算當(dāng)前圖像在每一類別的預(yù)測概率集P,選擇排前五的預(yù)測概率計(jì)算熵:
步驟1.3:定義用于提取類峰值響應(yīng)的類響應(yīng)圖:
其中,pi是將輸入圖像預(yù)測為第i個類的概率,為對應(yīng)的類響應(yīng)圖,δ為閾值,是預(yù)測概率最高的類對應(yīng)的類響應(yīng)圖;
步驟1.4:在設(shè)定大小的窗口內(nèi)對類響應(yīng)圖提取局部極大值,即得到類峰值響應(yīng)位置集合T={(x1,y1),(x2,y2),…,(xn,yn)},其中n為類峰值響應(yīng)的個數(shù)。
5.根據(jù)權(quán)利要求4所述的方法,其特征在于,在步驟1.3中,對類響應(yīng)圖Ro進(jìn)行最大值-最小值方式的歸一化,基于歸一化后的類響應(yīng)圖得到類峰值響應(yīng)位置集合T:
其中,R為歸一化后的類響應(yīng)圖,Ro為步驟1.3中得到的類響應(yīng)圖,min(Ro)為類響應(yīng)圖最小值,max(Ro)為類響應(yīng)圖最大值。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于中國科學(xué)院大學(xué),未經(jīng)中國科學(xué)院大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910942790.8/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 上一篇:產(chǎn)品分類方法、裝置、計(jì)算設(shè)備及計(jì)算機(jī)存儲介質(zhì)
- 下一篇:狀態(tài)感知數(shù)據(jù)特征提取方法及裝置、系統(tǒng)性能評估方法
- 同類專利
- 專利分類
G06K 數(shù)據(jù)識別;數(shù)據(jù)表示;記錄載體;記錄載體的處理
G06K9-00 用于閱讀或識別印刷或書寫字符或者用于識別圖形,例如,指紋的方法或裝置
G06K9-03 .錯誤的檢測或校正,例如,用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標(biāo)記或含有代碼標(biāo)記的打印字符的,例如,由不同形狀的各個筆畫組成的,而且每個筆畫表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理,即無須判定關(guān)于圖像的同一性而進(jìn)行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合





