[發(fā)明專(zhuān)利]基于各向異性卷積的圖像分類(lèi)方法及系統(tǒng)有效
| 申請(qǐng)?zhí)枺?/td> | 201911360305.2 | 申請(qǐng)日: | 2019-12-25 |
| 公開(kāi)(公告)號(hào): | CN111126494B | 公開(kāi)(公告)日: | 2023-09-26 |
| 發(fā)明(設(shè)計(jì))人: | 李文娟;李兵;胡衛(wèi)明;潘健;原春鋒;吳昊昊 | 申請(qǐng)(專(zhuān)利權(quán))人: | 中國(guó)科學(xué)院自動(dòng)化研究所 |
| 主分類(lèi)號(hào): | G06V10/764 | 分類(lèi)號(hào): | G06V10/764;G06V10/82;G06N3/0464;G06N3/045;G06N3/08 |
| 代理公司: | 北京市恒有知識(shí)產(chǎn)權(quán)代理事務(wù)所(普通合伙) 11576 | 代理人: | 郭文浩;尹文會(huì) |
| 地址: | 100190 *** | 國(guó)省代碼: | 北京;11 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 基于 各向異性 卷積 圖像 分類(lèi) 方法 系統(tǒng) | ||
1.一種基于各向異性卷積的圖像分類(lèi)方法,其特征在于,所述方法包括:
步驟A1,根據(jù)設(shè)定的標(biāo)準(zhǔn)圖像大小,將訓(xùn)練圖像與待分類(lèi)的圖像進(jìn)行預(yù)處理;
步驟A2,利用損失函數(shù)與預(yù)處理后的訓(xùn)練圖像對(duì)神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練優(yōu)化,其中,所述神經(jīng)網(wǎng)絡(luò)包括各向異性卷積層;
所述各向異性卷積層用于根據(jù)下式實(shí)現(xiàn)圖像或特征圖X到特征圖Y的線性變換:
其中,W代表卷積權(quán)重;p0表示圖像或特征圖X中的任意一點(diǎn)0的坐標(biāo);l0為該點(diǎn)對(duì)應(yīng)的最優(yōu)尺度因子;Δpn為所述最優(yōu)尺度因子對(duì)應(yīng)的形狀因子,為偏置項(xiàng);{pn|n=1,2,…,N},枚舉Q中的N個(gè)位置,N=|Q|,一個(gè)3×3的卷積中,Q定義為:
Q={(a,b)|a∈{-1,0,1},b∈{-1,0,1}}
其中,a和b為坐標(biāo)值;
步驟A3,利用訓(xùn)練好的神經(jīng)網(wǎng)絡(luò)對(duì)預(yù)處理后的待分類(lèi)圖像進(jìn)行特征提取與圖像分類(lèi)。
2.根據(jù)權(quán)利要求1所述的基于各向異性卷積的圖像分類(lèi)方法,其特征在于,所述神經(jīng)網(wǎng)絡(luò)的訓(xùn)練步驟包括:
步驟B1,對(duì)網(wǎng)絡(luò)參數(shù)進(jìn)行初始化操作;
步驟B2,將預(yù)處理后的訓(xùn)練圖像輸入所述神經(jīng)網(wǎng)絡(luò),提取圖像的特征信息,進(jìn)而得到圖像對(duì)應(yīng)的分類(lèi)標(biāo)簽;
步驟B3,基于所述損失函數(shù)計(jì)算所述分類(lèi)標(biāo)簽和訓(xùn)練圖像的實(shí)際類(lèi)別標(biāo)簽之間的誤差;
步驟B4,若誤差不在預(yù)期范圍,則進(jìn)行參數(shù)更新,并轉(zhuǎn)至步驟B2,直至將誤差控制在所述預(yù)期范圍內(nèi),得到訓(xùn)練好的所述神經(jīng)網(wǎng)絡(luò)。
3.根據(jù)權(quán)利要求2所述的基于各向異性卷積的圖像分類(lèi)方法,其特征在于,訓(xùn)練時(shí)p0點(diǎn)的所述最優(yōu)尺度因子與對(duì)應(yīng)的形狀因子的獲取方法包括:
在不同尺度基礎(chǔ)上獲取對(duì)應(yīng)的形狀因子,由對(duì)應(yīng)多種尺度的卷積變換提取多尺度關(guān)鍵特征,探測(cè)當(dāng)前尺度下物體的輪廓響應(yīng),根據(jù)最大激活響應(yīng)來(lái)選擇p0點(diǎn)的所述最優(yōu)尺度因子與對(duì)應(yīng)的形狀因子;
其中,p0表示圖像或特征圖X中的任意一點(diǎn)0的坐標(biāo)。
4.根據(jù)權(quán)利要求3所述的基于各向異性卷積的圖像分類(lèi)方法,其特征在于,“在不同尺度基礎(chǔ)上獲取對(duì)應(yīng)的形狀因子,由對(duì)應(yīng)多種尺度的卷積變換提取多尺度關(guān)鍵特征,探測(cè)當(dāng)前尺度下物體的輪廓響應(yīng),根據(jù)最大激活響應(yīng)來(lái)選擇p0點(diǎn)的所述最優(yōu)尺度因子與對(duì)應(yīng)的形狀因子”的步驟具體包括:
根據(jù)下式遍歷尺度因子與形狀因子的所有取值組合,進(jìn)而獲取所述最優(yōu)尺度因子與形狀因子:
其中,為尺度因子l的候選集;s為預(yù)設(shè)的尺度因子個(gè)數(shù);max代表最大值融合變換,用于根據(jù)各種尺度下提取得到的特征圖,選取極大值激活得到輸入圖像中的目標(biāo)物體位置與輪廓;Δpnl為與尺度因子l對(duì)應(yīng)的形狀因子,且
Δpnl∈{(c,d)|0≤cl,0≤dl}
其中,c和d為坐標(biāo)值。
5.根據(jù)權(quán)利要求4所述的基于各向異性卷積的圖像分類(lèi)方法,其特征在于,所述預(yù)設(shè)的尺度因子個(gè)數(shù)為s=3;
采用1、2、4三個(gè)尺度因子作為預(yù)設(shè)序列來(lái)提取輸入層不同尺度的特征信息,尺度因子1、2和4對(duì)應(yīng)的卷積核感受野大小分別為3×3、5×5和9×9。
6.根據(jù)權(quán)利要求1-5中任一項(xiàng)所述的基于各向異性卷積的圖像分類(lèi)方法,其特征在于,所述預(yù)處理包括:
對(duì)圖像進(jìn)行數(shù)據(jù)擴(kuò)增處理;
對(duì)數(shù)據(jù)擴(kuò)增處理后的圖像進(jìn)行裁剪,規(guī)范成設(shè)定的標(biāo)準(zhǔn)圖像大小。
7.根據(jù)權(quán)利要求1-5中任一項(xiàng)所述的基于各向異性卷積的圖像分類(lèi)方法,其特征在于,所述損失函數(shù)為softmax。
8.根據(jù)權(quán)利要求3-6中任一項(xiàng)所述的基于各向異性卷積的圖像分類(lèi)方法,其特征在于,所述形狀因子設(shè)置為八邊形,用于探測(cè)從中間點(diǎn)出發(fā)往八個(gè)方向的輪廓邊界,探測(cè)范圍在當(dāng)前尺度到兩倍尺度的區(qū)域環(huán)內(nèi)。
該專(zhuān)利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專(zhuān)利權(quán)人授權(quán)。該專(zhuān)利全部權(quán)利屬于中國(guó)科學(xué)院自動(dòng)化研究所,未經(jīng)中國(guó)科學(xué)院自動(dòng)化研究所許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買(mǎi)此專(zhuān)利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201911360305.2/1.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專(zhuān)利網(wǎng)。
- 卷積運(yùn)算處理方法及相關(guān)產(chǎn)品
- 一種卷積神經(jīng)網(wǎng)絡(luò)的計(jì)算方法及系統(tǒng)
- 卷積運(yùn)算方法及系統(tǒng)
- 卷積運(yùn)算方法、裝置及系統(tǒng)
- 深度神經(jīng)網(wǎng)絡(luò)裁剪方法、裝置及電子設(shè)備
- 基于卷積神經(jīng)網(wǎng)絡(luò)的圖像處理方法和圖像處理裝置
- 卷積神經(jīng)網(wǎng)絡(luò)及基于卷積神經(jīng)網(wǎng)絡(luò)的圖像處理方法
- 一種圖像處理方法、裝置以及計(jì)算機(jī)存儲(chǔ)介質(zhì)
- 用于卷積神經(jīng)網(wǎng)絡(luò)的卷積運(yùn)算裝置
- 基于FPGA實(shí)現(xiàn)圖像識(shí)別的方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 彩色圖像和單色圖像的圖像處理
- 圖像編碼/圖像解碼方法以及圖像編碼/圖像解碼裝置
- 圖像處理裝置、圖像形成裝置、圖像讀取裝置、圖像處理方法
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序以及圖像解碼程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序、以及圖像解碼程序
- 圖像形成設(shè)備、圖像形成系統(tǒng)和圖像形成方法
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序





