[發(fā)明專利]基于各向異性卷積的圖像分類方法及系統(tǒng)有效
| 申請?zhí)枺?/td> | 201911360305.2 | 申請日: | 2019-12-25 |
| 公開(公告)號: | CN111126494B | 公開(公告)日: | 2023-09-26 |
| 發(fā)明(設(shè)計)人: | 李文娟;李兵;胡衛(wèi)明;潘健;原春鋒;吳昊昊 | 申請(專利權(quán))人: | 中國科學院自動化研究所 |
| 主分類號: | G06V10/764 | 分類號: | G06V10/764;G06V10/82;G06N3/0464;G06N3/045;G06N3/08 |
| 代理公司: | 北京市恒有知識產(chǎn)權(quán)代理事務(wù)所(普通合伙) 11576 | 代理人: | 郭文浩;尹文會 |
| 地址: | 100190 *** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 基于 各向異性 卷積 圖像 分類 方法 系統(tǒng) | ||
本發(fā)明涉及深度學習與圖像分類領(lǐng)域,具體涉及一種基于各向異性卷積的圖像分類方法及系統(tǒng),目的在于解決當圖像分辨率低、物體尺度和形態(tài)多變等情況下難以保證物體分類識別的精度的問題。本發(fā)明的圖像分類方法包括:步驟A1,根據(jù)設(shè)定的標準圖像大小,將訓(xùn)練圖像與待分類圖像都進行預(yù)處理;步驟A2,利用利用損失函數(shù)與預(yù)處理后的訓(xùn)練樣本對神經(jīng)網(wǎng)絡(luò)進行訓(xùn)練優(yōu)化,其中,神經(jīng)網(wǎng)絡(luò)包括各向異性卷積層;步驟A3,利用訓(xùn)練好的神經(jīng)網(wǎng)絡(luò)對預(yù)處理后的待分類圖像進行特征提取與圖像分類。本發(fā)明的神經(jīng)網(wǎng)絡(luò)能快速提取判別性特征因子,準確鎖定圖像中的物體輪廓,較好應(yīng)對小圖像、多形變等分類難題,從而充分挖掘了圖像的空間信息,提高了物體分類的準確度。
技術(shù)領(lǐng)域
本發(fā)明涉及深度學習與圖像分類領(lǐng)域,具體涉及一種基于各向異性卷積的圖像分類方法及系統(tǒng)。
背景技術(shù)
隨著計算機視覺的發(fā)展,尤其是深度學習網(wǎng)絡(luò)模型的推廣,圖像分類技術(shù)取得了很大的進步,而且在現(xiàn)實中得到了很廣泛的應(yīng)用。但是圖像分類技術(shù)仍會遇到很大的困難,例如當圖像分辨率低、物體尺度和形態(tài)多變等情況下,難以保證物體分類識別的精度。
因此,希望提出一種新的深度學習網(wǎng)絡(luò)結(jié)構(gòu),該網(wǎng)絡(luò)配備高性能特征提取模塊,能快速提取判別性特征因子,準確鎖定圖像中的物體輪廓,較好應(yīng)對小圖像、多形變等分類難題。
發(fā)明內(nèi)容
為了解決現(xiàn)有技術(shù)中的上述問題,本發(fā)明提出了一種基于各向異性卷積的圖像分類方法及系統(tǒng),提高了物體分類的準確度。
本發(fā)明的一方面,涉及一種基于各向異性卷積的圖像分類方法,所述方法包括:
步驟A1,根據(jù)設(shè)定的標準圖像大小,將訓(xùn)練圖像與待分類的圖像進行預(yù)處理;
步驟A2,利用損失函數(shù)與預(yù)處理后的訓(xùn)練圖像對神經(jīng)網(wǎng)絡(luò)進行訓(xùn)練優(yōu)化,其中,所述神經(jīng)網(wǎng)絡(luò)包括各向異性卷積層;
步驟A3,利用訓(xùn)練好的神經(jīng)網(wǎng)絡(luò)對預(yù)處理后的待分類圖像進行特征提取與圖像分類。
優(yōu)選地,所述神經(jīng)網(wǎng)絡(luò)的訓(xùn)練步驟包括:
步驟B1,對網(wǎng)絡(luò)參數(shù)進行初始化操作;
步驟B2,將預(yù)處理后的訓(xùn)練圖像輸入所述神經(jīng)網(wǎng)絡(luò),提取圖像的特征信息,進而得到圖像對應(yīng)的分類標簽;
步驟B3,基于所述損失函數(shù)計算所述分類標簽和訓(xùn)練圖像的實際類別標簽之間的誤差;
步驟B4,若誤差不在預(yù)期范圍內(nèi),則進行參數(shù)更新,轉(zhuǎn)至步驟B2,直至將誤差控制在所述預(yù)期范圍內(nèi),得到訓(xùn)練好的所述神經(jīng)網(wǎng)絡(luò)。
優(yōu)選地,所述各向異性卷積層用于根據(jù)下式實現(xiàn)圖像或特征圖X到特征圖Y的線性變換:
其中,W代表卷積權(quán)重;p0表示圖像或特征圖X中的任意一點0的坐標;l0為該點對應(yīng)的最優(yōu)尺度因子;Δpn為所述最優(yōu)尺度因子對應(yīng)的形狀因子,為偏置項;{pn|n=1,2,…,N},枚舉Q中的N個位置,N=|Q|,一個3×3的卷積中,Q定義為:
Q={(a,b)|a∈[-1,0,1],b∈[-1,0,1]}
其中,a和b為坐標值。
優(yōu)選地,訓(xùn)練時p0點的所述最優(yōu)尺度因子與對應(yīng)的形狀因子的獲取方法包括:
在不同尺度基礎(chǔ)上獲取對應(yīng)的形狀因子,由對應(yīng)多種尺度的卷積變換提取多尺度關(guān)鍵特征,探測當前尺度下物體的輪廓響應(yīng),根據(jù)最大激活響應(yīng)來選擇p0點的所述最優(yōu)尺度因子與對應(yīng)的形狀因子;
其中,p0表示圖像或特征圖X中的任意一點0的坐標。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于中國科學院自動化研究所,未經(jīng)中國科學院自動化研究所許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201911360305.2/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 卷積運算處理方法及相關(guān)產(chǎn)品
- 一種卷積神經(jīng)網(wǎng)絡(luò)的計算方法及系統(tǒng)
- 卷積運算方法及系統(tǒng)
- 卷積運算方法、裝置及系統(tǒng)
- 深度神經(jīng)網(wǎng)絡(luò)裁剪方法、裝置及電子設(shè)備
- 基于卷積神經(jīng)網(wǎng)絡(luò)的圖像處理方法和圖像處理裝置
- 卷積神經(jīng)網(wǎng)絡(luò)及基于卷積神經(jīng)網(wǎng)絡(luò)的圖像處理方法
- 一種圖像處理方法、裝置以及計算機存儲介質(zhì)
- 用于卷積神經(jīng)網(wǎng)絡(luò)的卷積運算裝置
- 基于FPGA實現(xiàn)圖像識別的方法、裝置、設(shè)備及存儲介質(zhì)
- 彩色圖像和單色圖像的圖像處理
- 圖像編碼/圖像解碼方法以及圖像編碼/圖像解碼裝置
- 圖像處理裝置、圖像形成裝置、圖像讀取裝置、圖像處理方法
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序以及圖像解碼程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序、以及圖像解碼程序
- 圖像形成設(shè)備、圖像形成系統(tǒng)和圖像形成方法
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序





