[發明專利]圖像處理方法、裝置、設備和存儲介質在審
| 申請號: | 202310447093.1 | 申請日: | 2023-04-23 |
| 公開(公告)號: | CN116468905A | 公開(公告)日: | 2023-07-21 |
| 發明(設計)人: | 常軒;孟祥雨;叢煒 | 申請(專利權)人: | 國汽智控(重慶)科技有限公司;國汽智控(北京)科技有限公司 |
| 主分類號: | G06V10/44 | 分類號: | G06V10/44;G06V10/764;G06V10/82;G06N3/0464;G06N3/08 |
| 代理公司: | 北京同立鈞成知識產權代理有限公司 11205 | 代理人: | 楊麗;臧建明 |
| 地址: | 401331 重慶市沙*** | 國省代碼: | 重慶;50 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 圖像 處理 方法 裝置 設備 存儲 介質 | ||
本申請提供一種圖像處理方法、裝置、設備和存儲介質,涉及計算機視覺技術領域,該方法包括:獲取圖像的輸入特征和通道數,計算所述輸入特征的全局平均池化值和全局最大值池化值;根據所述通道數,計算得到一維通道卷積核;根據所述一維通道卷積核,計算所述全局平均池化值的卷積結果、全局最大值池化值的卷積結果;根據所述全局平均池化值的卷積結果和全局最大值池化值的卷積結果,確定所述輸入特征中每個通道的權重;根據所述輸入特征和每個通道的權重,計算得到目標特征圖,所述目標特征圖用于目標檢測。該技術方案改進了注意力機制,能夠減少計算資源的占用和特征丟失,提高計算機視覺效果。
技術領域
本申請涉及計算機視覺技術領域,尤其涉及一種圖像處理方法、裝置、設備和存儲介質。
背景技術
注意力機制方法被廣泛應用于計算機視覺模型如目標檢測、圖像分類中,它能從圖像提取特征中獲取到與目標更為相關的信息,排除干擾信息,從而使模型的性能更優。
現有技術中主流的注意力機制方法主要是將輸入特征經過兩個全連接層,然后通過激活函數得到不同通道下的權重,再將輸入特征與每個通道的權重相乘,即得到輸出結果。
但是,這種方式在輸入特征經過全連接層時,容易造成特征丟失,導致計算機視覺模型的性能下降,使得計算機視覺效果差。
發明內容
本申請提供一種圖像處理方法、裝置、設備和存儲介質,用于解決現有注意力機制方法存在缺陷,導致計算機視覺效果差的問題。
第一方面,本申請實施例提供一種圖像處理方法,包括:
獲取圖像的輸入特征和通道數,計算所述輸入特征的全局平均池化值和全局最大值池化值;
根據所述通道數,計算得到一維通道卷積核;
根據所述一維通道卷積核,計算所述全局平均池化值的卷積結果、全局最大值池化值的卷積結果;
根據所述全局平均池化值的卷積結果和全局最大值池化值的卷積結果,確定所述輸入特征中每個通道的權重;
根據所述輸入特征和每個通道的權重,計算得到目標特征圖,所述目標特征圖用于目標檢測。
在第一方面的一種可能設計中,所述計算所述輸入特征的全局平均池化值和全局最大值池化值,包括:
根據所述輸入特征,獲取所述圖像的寬、高和第i行第j列的像素值,其中,i,j均為正整數;
根據所述圖像的寬、高和第i行第j列的像素值,計算得到所述全局平均池化值;
獲取第i行第j列的像素值中的最大值,作為所述全局最大值池化值。
在第一方面的另一種可能設計中,所述根據所述圖像的寬、高和第i行第j列的像素值,計算得到所述全局平均池化值,包括:
上式中,g(x)表示全局平均池化值,W表示圖像的寬,H表示圖像的高,xi,j表示第i行第j列的像素值;
對應的,所述獲取在第i行第j列的元素值中的最大值,作為所述全局最大值池化值,包括:
上式中,h(x)表示全局最大值池化值,W表示圖像的寬,H表示圖像的高,xi,j表示第i行第j列的像素值。
在第一方面的再一種可能設計中,所述根據所述通道數,計算得到一維通道卷積核,包括:
上式中,k表示一維通道卷積核的大小,b、γ均為常量,C表示通道數,odd表示取距離計算值最近的奇數。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于國汽智控(重慶)科技有限公司;國汽智控(北京)科技有限公司,未經國汽智控(重慶)科技有限公司;國汽智控(北京)科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202310447093.1/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:重制DNPH捕集管的方法
- 下一篇:一種具備加濕功能的家用取暖器
- 彩色圖像和單色圖像的圖像處理
- 圖像編碼/圖像解碼方法以及圖像編碼/圖像解碼裝置
- 圖像處理裝置、圖像形成裝置、圖像讀取裝置、圖像處理方法
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序以及圖像解碼程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序、以及圖像解碼程序
- 圖像形成設備、圖像形成系統和圖像形成方法
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序





