[發明專利]基于各向異性卷積的圖像分類方法及系統有效
| 申請號: | 201911360305.2 | 申請日: | 2019-12-25 |
| 公開(公告)號: | CN111126494B | 公開(公告)日: | 2023-09-26 |
| 發明(設計)人: | 李文娟;李兵;胡衛明;潘健;原春鋒;吳昊昊 | 申請(專利權)人: | 中國科學院自動化研究所 |
| 主分類號: | G06V10/764 | 分類號: | G06V10/764;G06V10/82;G06N3/0464;G06N3/045;G06N3/08 |
| 代理公司: | 北京市恒有知識產權代理事務所(普通合伙) 11576 | 代理人: | 郭文浩;尹文會 |
| 地址: | 100190 *** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 各向異性 卷積 圖像 分類 方法 系統 | ||
1.一種基于各向異性卷積的圖像分類方法,其特征在于,所述方法包括:
步驟A1,根據設定的標準圖像大小,將訓練圖像與待分類的圖像進行預處理;
步驟A2,利用損失函數與預處理后的訓練圖像對神經網絡進行訓練優化,其中,所述神經網絡包括各向異性卷積層;
所述各向異性卷積層用于根據下式實現圖像或特征圖X到特征圖Y的線性變換:
其中,W代表卷積權重;p0表示圖像或特征圖X中的任意一點0的坐標;l0為該點對應的最優尺度因子;Δpn為所述最優尺度因子對應的形狀因子,為偏置項;{pn|n=1,2,…,N},枚舉Q中的N個位置,N=|Q|,一個3×3的卷積中,Q定義為:
Q={(a,b)|a∈{-1,0,1},b∈{-1,0,1}}
其中,a和b為坐標值;
步驟A3,利用訓練好的神經網絡對預處理后的待分類圖像進行特征提取與圖像分類。
2.根據權利要求1所述的基于各向異性卷積的圖像分類方法,其特征在于,所述神經網絡的訓練步驟包括:
步驟B1,對網絡參數進行初始化操作;
步驟B2,將預處理后的訓練圖像輸入所述神經網絡,提取圖像的特征信息,進而得到圖像對應的分類標簽;
步驟B3,基于所述損失函數計算所述分類標簽和訓練圖像的實際類別標簽之間的誤差;
步驟B4,若誤差不在預期范圍,則進行參數更新,并轉至步驟B2,直至將誤差控制在所述預期范圍內,得到訓練好的所述神經網絡。
3.根據權利要求2所述的基于各向異性卷積的圖像分類方法,其特征在于,訓練時p0點的所述最優尺度因子與對應的形狀因子的獲取方法包括:
在不同尺度基礎上獲取對應的形狀因子,由對應多種尺度的卷積變換提取多尺度關鍵特征,探測當前尺度下物體的輪廓響應,根據最大激活響應來選擇p0點的所述最優尺度因子與對應的形狀因子;
其中,p0表示圖像或特征圖X中的任意一點0的坐標。
4.根據權利要求3所述的基于各向異性卷積的圖像分類方法,其特征在于,“在不同尺度基礎上獲取對應的形狀因子,由對應多種尺度的卷積變換提取多尺度關鍵特征,探測當前尺度下物體的輪廓響應,根據最大激活響應來選擇p0點的所述最優尺度因子與對應的形狀因子”的步驟具體包括:
根據下式遍歷尺度因子與形狀因子的所有取值組合,進而獲取所述最優尺度因子與形狀因子:
其中,為尺度因子l的候選集;s為預設的尺度因子個數;max代表最大值融合變換,用于根據各種尺度下提取得到的特征圖,選取極大值激活得到輸入圖像中的目標物體位置與輪廓;Δpnl為與尺度因子l對應的形狀因子,且
Δpnl∈{(c,d)|0≤cl,0≤dl}
其中,c和d為坐標值。
5.根據權利要求4所述的基于各向異性卷積的圖像分類方法,其特征在于,所述預設的尺度因子個數為s=3;
采用1、2、4三個尺度因子作為預設序列來提取輸入層不同尺度的特征信息,尺度因子1、2和4對應的卷積核感受野大小分別為3×3、5×5和9×9。
6.根據權利要求1-5中任一項所述的基于各向異性卷積的圖像分類方法,其特征在于,所述預處理包括:
對圖像進行數據擴增處理;
對數據擴增處理后的圖像進行裁剪,規范成設定的標準圖像大小。
7.根據權利要求1-5中任一項所述的基于各向異性卷積的圖像分類方法,其特征在于,所述損失函數為softmax。
8.根據權利要求3-6中任一項所述的基于各向異性卷積的圖像分類方法,其特征在于,所述形狀因子設置為八邊形,用于探測從中間點出發往八個方向的輪廓邊界,探測范圍在當前尺度到兩倍尺度的區域環內。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國科學院自動化研究所,未經中國科學院自動化研究所許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201911360305.2/1.html,轉載請聲明來源鉆瓜專利網。
- 彩色圖像和單色圖像的圖像處理
- 圖像編碼/圖像解碼方法以及圖像編碼/圖像解碼裝置
- 圖像處理裝置、圖像形成裝置、圖像讀取裝置、圖像處理方法
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序以及圖像解碼程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序、以及圖像解碼程序
- 圖像形成設備、圖像形成系統和圖像形成方法
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序





