[發(fā)明專利]一種圖像處理方法、裝置、電子設(shè)備及存儲(chǔ)介質(zhì)在審
| 申請(qǐng)?zhí)枺?/td> | 202210379819.8 | 申請(qǐng)日: | 2022-04-12 |
| 公開(公告)號(hào): | CN114677528A | 公開(公告)日: | 2022-06-28 |
| 發(fā)明(設(shè)計(jì))人: | 戴銘;鄭恩輝;黃景林 | 申請(qǐng)(專利權(quán))人: | 中國計(jì)量大學(xué) |
| 主分類號(hào): | G06V10/74 | 分類號(hào): | G06V10/74;G06V10/764;G06V10/82;G06V10/42;G06N3/04;G06K9/62 |
| 代理公司: | 北京卓恒知識(shí)產(chǎn)權(quán)代理事務(wù)所(特殊普通合伙) 11394 | 代理人: | 孔鵬 |
| 地址: | 310018 浙江省*** | 國省代碼: | 浙江;33 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 圖像 處理 方法 裝置 電子設(shè)備 存儲(chǔ) 介質(zhì) | ||
本申請(qǐng)?zhí)峁┝艘环N圖像處理方法、裝置、電子設(shè)備及存儲(chǔ)介質(zhì),涉及圖像處理技術(shù)領(lǐng)域。首先獲取輸入圖像,然后將輸入圖像進(jìn)行切割,以獲取多個(gè)元素,再對(duì)多個(gè)元素進(jìn)行壓縮,以獲取固定維度的數(shù)據(jù)信息,然后將數(shù)據(jù)信息與位置編碼組合后輸入變換層,以獲取全局向量,最后將全局變量輸入分類器層,以獲取512維的特征向量與分類特征向量,其中,512維的特征向量用于圖像匹配,分類特征向量用于確定輸入圖像的類別。本申請(qǐng)?zhí)峁┑膱D像處理方法、裝置、電子設(shè)備及存儲(chǔ)介質(zhì)具有提升了定位的準(zhǔn)確度的效果。
技術(shù)領(lǐng)域
本申請(qǐng)涉及圖像處理技術(shù)領(lǐng)域,具體而言,涉及一種圖像處理方法、裝置、電子設(shè)備及存儲(chǔ)介質(zhì)。
背景技術(shù)
現(xiàn)今無人機(jī)搭載的圖像處理和導(dǎo)航系統(tǒng)都依賴于衛(wèi)星系統(tǒng)來提供精確的經(jīng)緯度位置信息,然而在實(shí)際使用的時(shí)候,無人機(jī)難免會(huì)運(yùn)行在無GNSS(Global NavigationSatellite System,全球?qū)Ш叫l(wèi)星系統(tǒng))信號(hào)的環(huán)境中,此時(shí)無人機(jī)將無法完成圖像處理,給無人機(jī)的使用帶來不便。
在此情況下,可以利用無人機(jī)拍攝的圖片與的衛(wèi)星圖片進(jìn)行比對(duì)的方式,確定無人機(jī)當(dāng)前位置的坐標(biāo)。
現(xiàn)有圖像處理過程中,普遍采用resnet-50模型進(jìn)行處理,然而,由于密集型無人機(jī)地理定位的任務(wù)中,不同來源的圖像之間存在視角偏差,因此采用resnet-50模型進(jìn)行圖像處理時(shí),其定位結(jié)果可能存在偏差。
綜上,現(xiàn)有技術(shù)中存在采用resnet-50模型進(jìn)行圖像處理時(shí),其定位結(jié)果可能存在偏差的問題。
發(fā)明內(nèi)容
本申請(qǐng)的目的在于提供一種圖像處理方法、裝置、電子設(shè)備及存儲(chǔ)介質(zhì),以解決現(xiàn)有技術(shù)中存在的采用resnet-50模型進(jìn)行圖像處理時(shí),其定位結(jié)果可能存在偏差的問題。
為了實(shí)現(xiàn)上述目的,本申請(qǐng)實(shí)施例采用的技術(shù)方案如下:
第一方面,本申請(qǐng)實(shí)施例提供了一種圖像處理方法,所述圖像處理方法包括:
獲取輸入圖像;
將輸入圖像進(jìn)行切割,以獲取多個(gè)元素;
對(duì)所述多個(gè)元素進(jìn)行壓縮,以獲取固定維度的數(shù)據(jù)信息;
將所述數(shù)據(jù)信息與位置編碼組合后輸入變換層,以獲取所述全局向量;
將所述全局變量輸入分類器層,以獲取512維的特征向量與分類特征向量,其中,所述512維的特征向量用于圖像匹配,所述分類特征向量用于確定所述輸入圖像的類別。
可選地,所述將輸入圖像進(jìn)行切割的步驟包括:
將所述圖像切割為16*16大小的多個(gè)元素。
可選地,所述對(duì)所述多個(gè)元素進(jìn)行壓縮,以獲取固定維度的數(shù)據(jù)信息的步驟包括:
將每個(gè)元素拉平;
將拉平后的元素映射至固定維度的數(shù)據(jù)信息。
可選地,將所述數(shù)據(jù)信息與位置編碼組合后輸入變換層的步驟包括:
依據(jù)所述數(shù)據(jù)信息生成CLS符號(hào)的token;
生成所述數(shù)據(jù)信息對(duì)應(yīng)的位置編碼;
將所述token與所述位置編碼相加后輸入變換層。
可選地,在所述將所述全局變量輸入分類器層,以獲取512維的特征向量與分類特征向量的步驟之后,所述方法還包括:
獲得目標(biāo)圖像的512維的特征向量;
確定所述目標(biāo)圖像與所述輸入圖像的512維的特征向量的相似度,以確定所述輸入圖像與所述目標(biāo)圖像是否匹配。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于中國計(jì)量大學(xué),未經(jīng)中國計(jì)量大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202210379819.8/2.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 彩色圖像和單色圖像的圖像處理
- 圖像編碼/圖像解碼方法以及圖像編碼/圖像解碼裝置
- 圖像處理裝置、圖像形成裝置、圖像讀取裝置、圖像處理方法
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序以及圖像解碼程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序、以及圖像解碼程序
- 圖像形成設(shè)備、圖像形成系統(tǒng)和圖像形成方法
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 一種數(shù)據(jù)庫讀寫分離的方法和裝置
- 一種手機(jī)動(dòng)漫人物及背景創(chuàng)作方法
- 一種通訊綜合測(cè)試終端的測(cè)試方法
- 一種服裝用人體測(cè)量基準(zhǔn)點(diǎn)的獲取方法
- 系統(tǒng)升級(jí)方法及裝置
- 用于虛擬和接口方法調(diào)用的裝置和方法
- 線程狀態(tài)監(jiān)控方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)
- 一種JAVA智能卡及其虛擬機(jī)組件優(yōu)化方法
- 檢測(cè)程序中方法耗時(shí)的方法、裝置及存儲(chǔ)介質(zhì)
- 函數(shù)的執(zhí)行方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)





