[發(fā)明專利]圖像識別方法及相關(guān)裝置有效
| 申請?zhí)枺?/td> | 201911337591.0 | 申請日: | 2019-12-23 |
| 公開(公告)號: | CN111126258B | 公開(公告)日: | 2023-06-23 |
| 發(fā)明(設(shè)計)人: | 賀武;陳微;張鵬 | 申請(專利權(quán))人: | 深圳市華尊科技股份有限公司 |
| 主分類號: | G06V20/58 | 分類號: | G06V20/58;G06V10/25;G06V10/52;G06V10/764;G06V10/77;G06V10/82;G06N3/04;G06N3/082 |
| 代理公司: | 廣州三環(huán)專利商標代理有限公司 44202 | 代理人: | 熊永強 |
| 地址: | 518000 廣東省深圳市福田*** | 國省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 圖像 識別 方法 相關(guān) 裝置 | ||
1.一種圖像識別方法,其特征在于,應(yīng)用于電子設(shè)備,所述方法包括:
獲取目標圖像;
將所述目標圖像輸入到主干網(wǎng)絡(luò)進行特征提取,得到不同尺度下的多個第一特征圖,所述主干網(wǎng)絡(luò)的每一尺度所在層均為通過通道注意力模塊進行自注意力蒸餾學習以及所述主干網(wǎng)絡(luò)的每一尺度所在層均為通過空間注意力模塊進行特征融合提取;
通過所述多個第一特征圖進行后處理,得到至少一個目標;
確定所述多個第一特征圖對應(yīng)的空間注意力特征圖,得到多個第一空間注意力特征圖,依據(jù)所述多個第一空間注意力特征圖確定第一感興趣區(qū)域特征圖;
將所述第一感興趣區(qū)域特征圖輸入到所述主干網(wǎng)絡(luò)進行特征提取,得到不同尺度下的多個第二特征圖;
通過所述多個第二特征圖進行目標屬性識別確定至少一個目標屬性;
將所述至少一個目標和所述至少一個目標屬性作為目標圖像識別結(jié)果;
其中,所述通過所述多個第一特征圖后處理,得到至少一個目標,包括:
通過目標神經(jīng)網(wǎng)絡(luò)模型將所述多個第一特征圖進行后處理,得到所述至少一個目標;
所述目標神經(jīng)網(wǎng)絡(luò)模型包括BatchNorm層,且所述BatchNorm層已添加蒙版,實現(xiàn)對抗稀疏訓練,該稀疏訓練用于所述目標神經(jīng)網(wǎng)絡(luò)模型剪枝壓縮;
其中,所述方法還包括:
獲取第一訓練集,所述第一訓練集包括多個樣本;
對所述第一訓練集的樣本進行擾動操作,得到第二訓練集;
將所述第一訓練集和所述第二訓練集輸入到預設(shè)神經(jīng)網(wǎng)絡(luò)進行對抗訓練,得到所述目標神經(jīng)網(wǎng)絡(luò)模型;
其中,所述將所述第一訓練集和第二訓練集輸入到預設(shè)神經(jīng)網(wǎng)絡(luò)進行對抗訓練,得到所述目標神經(jīng)網(wǎng)絡(luò)模型,包括:
獲取樣本k,所述樣本k為所述第一訓練樣本和所述第二訓練樣本中的任一樣本;
將所述樣本k輸入到所述主干網(wǎng)絡(luò),得到不同尺度下的多個第一尺度特征圖;
依據(jù)所述多個第一尺度特征圖確定多個通道注意力特征圖;
依據(jù)所述多個通道注意力特征圖進行自注意力蒸餾,以學習多尺度下的更加豐富的融合特征,并利用學習之后的所述多個通道注意力特征圖優(yōu)化所述主干網(wǎng)絡(luò);
和/或,
確定所述多個第一尺度特征圖對應(yīng)的空間注意力特征圖,得到多個第二空間注意力特征圖;
依據(jù)所述多個第二空間注意力特征圖確定第二感興趣區(qū)域特征圖;
將所述第二感興趣區(qū)域特征圖輸入到所述主干網(wǎng)絡(luò)進行特征提取,得到不同尺度下的多個第二尺度特征圖;
依據(jù)所述多個第二尺度特征圖確定多個第三空間注意力特征圖;
依據(jù)所述多個第三空間注意力特征圖進行特征融合提取,以學習局部細粒度特征,并利用特征融合提取后的所述多個第三空間注意力特征圖優(yōu)化所述主干網(wǎng)絡(luò)。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述確定所述多個第一特征圖對應(yīng)的空間注意力特征圖,得到多個第一空間注意力特征圖,依據(jù)所述多個第一空間注意力特征圖確定第一感興趣區(qū)域特征圖,包括:
對所述多個第一特征圖進行分組操作,得到多組第一特征圖;
對所述多組第一特征圖中每一組第一特征圖進行全局平均池化操作,得到多組重要性權(quán)重特征,每一組第一特征圖對應(yīng)一組重要性權(quán)重特征;
將所述多組第一特征圖和所述多組重要性權(quán)重特征進行點乘mul運算,得到多組特征圖;
將所述多組特征圖進行最大響應(yīng)縮減,得到多個單通道特征圖;
將所述多個單通道特征圖輸入到激活函數(shù),得到多個第一空間注意力特征圖;
將所述多個第一空間注意力特征圖進行concat操作,以融合為目標空間注意力特征圖;
對所述目標空間注意力特征圖進行感興趣區(qū)域提取,得到所述第一感興趣區(qū)域特征圖。
3.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述依據(jù)所述多個第一尺度特征圖確定多個通道注意力特征圖,包括:
將所述多個第一尺度特征圖中每一第一尺度特征圖輸入到所述通道注意力模塊,得到中間通道注意力特征圖,并利用淺層的中間通道注意力特征圖優(yōu)化深層的中間通道注意力特征圖,得到所述多個通道注意力特征圖。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于深圳市華尊科技股份有限公司,未經(jīng)深圳市華尊科技股份有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201911337591.0/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 彩色圖像和單色圖像的圖像處理
- 圖像編碼/圖像解碼方法以及圖像編碼/圖像解碼裝置
- 圖像處理裝置、圖像形成裝置、圖像讀取裝置、圖像處理方法
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序以及圖像解碼程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序、以及圖像解碼程序
- 圖像形成設(shè)備、圖像形成系統(tǒng)和圖像形成方法
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序





