[發(fā)明專利]一種輕量化的無人機圖像小目標檢測方法有效
| 申請?zhí)枺?/td> | 202010819487.1 | 申請日: | 2020-08-14 |
| 公開(公告)號: | CN112101113B | 公開(公告)日: | 2022-05-27 |
| 發(fā)明(設(shè)計)人: | 李紅光;王蒙;丁文銳 | 申請(專利權(quán))人: | 北京航空航天大學 |
| 主分類號: | G06V20/13 | 分類號: | G06V20/13;G06V10/32;G06V10/44;G06V10/764;G06V10/82;G06K9/62;G06N3/04;G06N3/08 |
| 代理公司: | 北京永創(chuàng)新實專利事務(wù)所 11121 | 代理人: | 祗志潔 |
| 地址: | 100191*** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 量化 無人機 圖像 目標 檢測 方法 | ||
本發(fā)明提供了一種輕量化的無人機圖像小目標檢測方法,屬于無人機圖像處理技術(shù)領(lǐng)域。本發(fā)明對輸入的待測無人機圖像視頻按時序?qū)γ恳粠瑘D像進行處理,包括:將圖像縮放后輸入Revised MobileNetV2特征提取器,輸出特征圖;特征圖輸入同步上采樣和檢測模塊,獲得目標中心點位置和對應(yīng)尺度,得到幀內(nèi)所有預(yù)測目標邊界框;對待測視頻的所有幀進行處理后,對所有幀的預(yù)測結(jié)果進行快速序列非最大值抑制處理,輸出待測視頻的目標檢測結(jié)果。本發(fā)明使用輕量化的骨干網(wǎng)進行無人機圖像中小目標檢測,降低了小目標的誤檢,提高了檢測效率,可實現(xiàn)無人機圖像視頻中小目標快速、準確地檢測。
技術(shù)領(lǐng)域
本發(fā)明屬于無人機圖像處理技術(shù)領(lǐng)域,具體涉及一種輕量化的無人機圖像小目標檢測方法。
背景技術(shù)
隨著無人機技術(shù)的成熟和無人機供應(yīng)商數(shù)量的增長,無人機成本逐漸降低,近年來,無人機在地質(zhì)學、農(nóng)林業(yè)、人流/車流監(jiān)控等多個領(lǐng)域均受到廣泛關(guān)注。無人機自身可以攜帶多種外設(shè)傳感器,包括紅外圖像傳感器、可見光圖像傳感器、加速度傳感器、氣壓傳感器等等,其中可見光圖像傳感器能夠提供豐富的環(huán)境信息,因此,無人機可見光圖像理解技術(shù)是無人機應(yīng)用研究的熱門領(lǐng)域之一。其中目標檢測技術(shù)可以定位圖像中的感興趣類別目標,無疑能夠為各種無人機任務(wù)提供有效支持。
根據(jù)MS COCO(Microsoft Common Objects in Context)數(shù)據(jù)集的定義,像素數(shù)≤32×32的目標被認定為小目標。無人機圖像中的典型目標存在尺度小、數(shù)量大、分布密集的特點。
目標檢測技術(shù)發(fā)展已久,從基于手工設(shè)計特征的傳統(tǒng)方法到基于卷積神經(jīng)網(wǎng)絡(luò)的深度學習方法,檢測精度不斷提升。當前,基于卷積神經(jīng)網(wǎng)絡(luò)的方法是目標檢測技術(shù)的主流方法。多數(shù)無人機可見光圖像目標檢測算法的優(yōu)化目標是盡可能提升精度,較少考慮效率問題。基于無人機機上平臺的目標檢測具有重要意義,不僅能提升無人機應(yīng)用的靈活性和無人機自身的智能化水平,還能克服惡劣的通信環(huán)境進行工作。但是,無人機機上平臺的存儲和計算資源受限,需要目標檢測算法具有較低的計算量和參數(shù)量。
發(fā)明內(nèi)容
基于目前無人機目標檢測的重要性以及需要檢測方法計算量和參數(shù)量低的要求,本發(fā)明針對可見光無人機圖像,結(jié)合在無人機機上平臺進行目標檢測的場景,提出了一個輕量化的無人機圖像小目標檢測方法。其中,無人機圖像數(shù)據(jù)源為視頻格式,即輸入無人機圖像為按照時序順序的視頻各幀。
本發(fā)明提供的輕量化的無人機圖像小目標檢測方法,包括以下步驟:
步驟一:將當前待檢測幀圖像縮放至512×512像素的大小;
步驟二:縮放后的圖像輸入Revised MobileNetV2特征提取器,輸出尺度為16×16的特征圖;
步驟三:將提取的特征圖輸入同步上采樣和檢測模塊。同步上采樣和檢測模塊包含基于子像素卷積結(jié)構(gòu)的四個分支。四個分支分別為中心點分支、中心點偏移分支、中心點目標性分支和尺度分支。前三個分支共同決定中心點的位置,尺度分支決定各中心點對應(yīng)目標的尺度;
步驟四:通過預(yù)測的目標中心點位置和對應(yīng)尺度得到當前幀的所有預(yù)測目標框,保存結(jié)果。判斷當前待測視頻的所有幀是否都得到了檢測,如果是,檢測完畢進入步驟五,否則,對未檢測的幀返回步驟一繼續(xù)執(zhí)行;
步驟五:對待測視頻的所有幀預(yù)測結(jié)果進行快速序列非最大值抑制處理,得到最終的目標檢測結(jié)果。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于北京航空航天大學,未經(jīng)北京航空航天大學許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010819487.1/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 彩色圖像和單色圖像的圖像處理
- 圖像編碼/圖像解碼方法以及圖像編碼/圖像解碼裝置
- 圖像處理裝置、圖像形成裝置、圖像讀取裝置、圖像處理方法
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序以及圖像解碼程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序、以及圖像解碼程序
- 圖像形成設(shè)備、圖像形成系統(tǒng)和圖像形成方法
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序





