[發(fā)明專(zhuān)利]面向無(wú)人機(jī)航拍圖像的分割引導(dǎo)注意力群體計(jì)數(shù)方法在審
| 申請(qǐng)?zhí)枺?/td> | 202210740932.4 | 申請(qǐng)日: | 2022-06-28 |
| 公開(kāi)(公告)號(hào): | CN115019211A | 公開(kāi)(公告)日: | 2022-09-06 |
| 發(fā)明(設(shè)計(jì))人: | 范哲意;宋梓豪;吳迪;朱藝璇 | 申請(qǐng)(專(zhuān)利權(quán))人: | 北京理工大學(xué) |
| 主分類(lèi)號(hào): | G06V20/17 | 分類(lèi)號(hào): | G06V20/17;G06V10/82;G06V10/26;G06N3/08;G06N3/04 |
| 代理公司: | 北京康度知識(shí)產(chǎn)權(quán)代理事務(wù)所(特殊普通合伙) 11705 | 代理人: | 王彬 |
| 地址: | 100081 *** | 國(guó)省代碼: | 北京;11 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 面向 無(wú)人機(jī) 航拍 圖像 分割 引導(dǎo) 注意力 群體 計(jì)數(shù) 方法 | ||
1.一種面向無(wú)人機(jī)航拍圖像的分割引導(dǎo)注意力群體計(jì)數(shù)方法,所述方法包括:
獲取包括訓(xùn)練集和測(cè)試集在內(nèi)的圖像集;
對(duì)訓(xùn)練集中的圖像進(jìn)行預(yù)處理;
將預(yù)處理后的圖像輸入網(wǎng)絡(luò),訓(xùn)練網(wǎng)絡(luò),直至網(wǎng)絡(luò)擬合,訓(xùn)練后的網(wǎng)絡(luò)輸出圖像的密度圖和分割圖,所述網(wǎng)絡(luò)包括卷積塊,Inception級(jí)聯(lián)模塊、上采樣器、淺層分割引導(dǎo)注意力模塊、深層分割引導(dǎo)注意力模塊以及第一加法器和第二加法器;以及
根據(jù)網(wǎng)絡(luò)輸出的密度圖,將密度圖的像素值求和得到圖像中的群體計(jì)數(shù)。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,訓(xùn)練網(wǎng)絡(luò)的步驟包括:
卷積塊將預(yù)處理后的圖像處理為特征F1,F(xiàn)1的通道數(shù)為768;
將特征F1分別輸入Inception級(jí)聯(lián)模塊和淺層分割引導(dǎo)注意力模塊,分別得到特征F2,S1和D1,特征F2的通道數(shù)為2048,S1的通道數(shù)為1,特征D1的通道數(shù)為1;
通過(guò)上采樣器對(duì)得到的特征F2進(jìn)行上采樣,上采樣后的特征的尺寸變?yōu)樘卣鱂2的兩倍,然后將上采樣后的特征F2輸入深層分割引導(dǎo)注意力模塊,分別得到特征S2和D2,特征S2和特征D2的通道數(shù)分別為1和1;
通過(guò)第一加法器將得到的特征S1和S2加權(quán)求和,最終得到與輸入圖像尺寸相同的預(yù)測(cè)分割圖;
通過(guò)第二加法器將得到的特征D1和D2加權(quán)求和,最終得到與輸入圖像尺寸相同的預(yù)測(cè)密度圖;
通過(guò)調(diào)整特征S1和S2以及特征D1和D2的權(quán)重以使最小化損失函數(shù),直至網(wǎng)絡(luò)擬合,
損失函數(shù)為:
表示密度圖損失,如式(2),
其中表示生成的第i張輸入圖像Xi對(duì)應(yīng)的預(yù)測(cè)密度圖,θ表示整個(gè)網(wǎng)絡(luò)可訓(xùn)練的參數(shù),Di表示圖像Xi的真值密度圖,N是訓(xùn)練樣本數(shù),
表示分割圖損失,如式(3),
其中表示生成的第i張輸入圖像Xi對(duì)應(yīng)的預(yù)測(cè)分割圖,Wi表示真值分割圖,Hi(j,k)構(gòu)成交叉熵?fù)p失矩陣H,(j,k)是預(yù)測(cè)分割圖里的每個(gè)點(diǎn)的坐標(biāo),⊙表示逐元素乘法。
3.根據(jù)權(quán)利要求2所述的方法,其特征在于,卷積塊包括5個(gè)卷積層、第一InceptionA至第三InceptionA、InceptionB以及第一InceptionC至第四InceptionC。
5個(gè)卷積層分別是:
Conv:3×3,32;
Conv:3×3,32;
Conv:3×3,64;
Conv:3×3,80;
Conv:3×3,192;
其中,Conv為卷積,3×3,32表示卷積核大小為3×3,輸出特征的通道數(shù)為32;3×3,64表示卷積核大小為3×3,輸出特征的通道數(shù)為64,3×3,80表示卷積核大小為3×3,輸出特征的通道數(shù)為80,3×3,192表示卷積核大小為3×3,輸出特征的通道數(shù)為192;
InceptionA:將輸入特征復(fù)制4份,將其分別送入4條分支,從左到右,分支A1對(duì)輸入特征進(jìn)行1×1卷積;分支A2對(duì)輸入特征先進(jìn)行1×1卷積再進(jìn)行5×5卷積;分支A3對(duì)輸入特征首先進(jìn)行1×1卷積,再進(jìn)行兩次3×3卷積;分支A4對(duì)輸入特征先進(jìn)行池化操作再進(jìn)行1×1卷積,最后將4個(gè)分支的所有輸出按照通道聯(lián)接,作為最終輸出特征,其通道數(shù)為288;
InceptionB:將輸入特征復(fù)制3份,將其分別送入3條分支,從左到右,分支B1對(duì)輸入特征進(jìn)行3×3卷積;分支B2對(duì)輸入特征首先進(jìn)行1×1卷積,再進(jìn)行兩次3×3卷積;分支B3對(duì)輸入特征進(jìn)行池化操作,最后將3個(gè)分支的所有輸出按照通道聯(lián)接,作為最終輸出特征,其通道數(shù)為768;
InceptionC:將輸入特征復(fù)制4份,將其分別送入4條分支,從左到右,分支C1對(duì)輸入特征進(jìn)行1×1卷積;分支C2對(duì)輸入先進(jìn)行1×1卷積再進(jìn)行深度可分離卷積,其中深度可分離卷積由1×7和7×1卷積組成;分支C3對(duì)輸入特征首先進(jìn)行1×1卷積,再進(jìn)行兩次深度可分離卷積,其中深度可分離卷積由1×7和7×1卷積組成;分支C4對(duì)輸入特征進(jìn)行池化操作再進(jìn)行1×1卷積;最后將4個(gè)分支的所有輸出按照通道聯(lián)接,作為最終輸出特征,其通道數(shù)為768。
該專(zhuān)利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專(zhuān)利權(quán)人授權(quán)。該專(zhuān)利全部權(quán)利屬于北京理工大學(xué),未經(jīng)北京理工大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買(mǎi)此專(zhuān)利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202210740932.4/1.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專(zhuān)利網(wǎng)。
- 無(wú)人機(jī)監(jiān)控方法、系統(tǒng)以及無(wú)人機(jī)和地面站
- 無(wú)人機(jī)拍攝方法及裝置、無(wú)人機(jī)和地面控制裝置
- 一種獨(dú)立式無(wú)人機(jī)飛行安全監(jiān)測(cè)與信息管理系統(tǒng)
- 一種確定無(wú)人機(jī)飛行路徑的方法及裝置
- 一種執(zhí)行任務(wù)時(shí)無(wú)人機(jī)群數(shù)據(jù)鏈真實(shí)性檢測(cè)方法
- 連發(fā)無(wú)人機(jī)電磁彈射系統(tǒng)及無(wú)人機(jī)機(jī)庫(kù)
- 用于無(wú)人機(jī)超視距管控的系統(tǒng)及其工作方法
- 連發(fā)無(wú)人機(jī)電磁彈射系統(tǒng)及無(wú)人機(jī)機(jī)庫(kù)
- 一種無(wú)人機(jī)遙感組網(wǎng)冗余容錯(cuò)控制方法
- 無(wú)人機(jī)的控制方法、裝置、計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)及無(wú)人機(jī)
- 一種用于低空監(jiān)控的新型航拍設(shè)備
- 一種大型旋翼機(jī)的航拍支架結(jié)構(gòu)
- 一種無(wú)人機(jī)航拍服務(wù)的內(nèi)容處理方法及系統(tǒng)
- 一種大型旋翼機(jī)的航拍支架
- 信息處理裝置、航拍路徑生成方法、航拍路徑生成系統(tǒng)、程序以及記錄介質(zhì)
- 信息處理裝置、航拍路徑生成方法、航拍路徑生成系統(tǒng)、程序以及記錄介質(zhì)
- 基于區(qū)塊鏈的航拍激勵(lì)管理方法及系統(tǒng)
- 一種航拍相機(jī)曝光時(shí)間上限閾值獲取方法及獲取系統(tǒng)
- 航拍圖像的視覺(jué)對(duì)位算法篩選及參數(shù)優(yōu)化系統(tǒng)和方法
- 一種國(guó)土資源監(jiān)管用航拍裝置
- 彩色圖像和單色圖像的圖像處理
- 圖像編碼/圖像解碼方法以及圖像編碼/圖像解碼裝置
- 圖像處理裝置、圖像形成裝置、圖像讀取裝置、圖像處理方法
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序以及圖像解碼程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序、以及圖像解碼程序
- 圖像形成設(shè)備、圖像形成系統(tǒng)和圖像形成方法
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序





