[發明專利]一種增強注意力區域生成網絡的小樣本目標檢測方法在審
| 申請號: | 202110651171.0 | 申請日: | 2021-06-10 |
| 公開(公告)號: | CN113327239A | 公開(公告)日: | 2021-08-31 |
| 發明(設計)人: | 劉麗穎;張笑欽;徐曰旺;黃自瑋 | 申請(專利權)人: | 溫州大學 |
| 主分類號: | G06T7/00 | 分類號: | G06T7/00;G06T5/00;G06T3/60;G06T3/40;G06N3/04;G06N3/08 |
| 代理公司: | 北京陽光天下知識產權代理事務所(普通合伙) 11671 | 代理人: | 趙飛 |
| 地址: | 325035 浙江省溫州市甌海經濟*** | 國省代碼: | 浙江;33 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 增強 注意力 區域 生成 網絡 樣本 目標 檢測 方法 | ||
1.一種增強注意力區域生成網絡的小樣本目標檢測方法,其特征在于,包括:
獲取與檢測目標相關的數據信息;
對獲取的數據信息進行預處理;
搭建RetinaNet網絡,并將經過預處理的數據輸入到搭建好的RetinaNet網絡進行訓練;
將待檢測圖像或視頻輸入至訓練好的RetinaNet網絡進行檢測。
2.根據權利要求1所述的增強注意力區域生成網絡的小樣本目標檢測方法,其特征在于,所述與檢測目標相關的數據信息包括圖像數據和視頻數據,所述與檢測目標相關的數據信息的獲取方法包括網絡爬蟲和攝像機采集,所述網絡爬蟲通過Bing、Baidu和Google圖片庫搜索與檢測目標相關的關鍵詞爬取數據并保存至控制器中,所述控制器用于對接收到的數據信息進行存儲和處理,并根據處理結果發送控制信號至相應模塊;所述攝像機采集通過攝像機模塊獲取數據信息,所述攝像機模塊包括云臺攝像機、驅動電機、紅外傳感器、亮度傳感器和補光燈,所述云臺攝像機用于采集圖像與視頻信息,所述驅動電機與所述云臺攝像機相連接,所述驅動電機用于驅動所述云臺攝像機進行轉動,所述紅外傳感器、所述亮度傳感器和所述補光燈均安裝在所述云臺攝像機的云臺上,所述紅外傳感器用于檢測拍攝目標是否存在以及拍攝目標的距離信息,所述亮度傳感器用于采集環境亮度信息,所述補光燈用于對所述云臺攝像機進行拍攝補光。
3.根據權利要求2所述的增強注意力區域生成網絡的小樣本目標檢測方法,其特征在于,所述控制器包括云臺解碼單元和比較單元,所述云臺解碼單元用于根據目標的信息發送轉動控制信號至所述驅動電機驅動所述云臺攝像機的轉動,所述比較單元用于對所述紅外傳感器采集的距離數據與距離預設值和所述亮度傳感器采集的亮度數據與亮度預設值進行比較,并根據距離比較結果控制所述云臺攝像機的光圈以及焦距的調整,根據亮度比較結果控制所述補光燈的開啟與關閉。
4.根據權利要求1所述的增強注意力區域生成網絡的小樣本目標檢測方法,其特征在于,所述對獲取的數據信息進行預處理包括:進行數據篩選;對經過數據篩選后的數據進行數據清洗;對經過數據清洗處理后的數據進行數據標注;對經過數據標注處理后的數據進行數據增強。
5.根據權利要求4所述的增強注意力區域生成網絡的小樣本目標檢測方法,其特征在于,所述數據篩選包括通過圖像數據篩選單元篩選圖像數據和通過視頻數據篩選單元篩選視頻數據,所述圖像數據篩選單元用于將圖像內容為檢測目標數據、拍攝目標占比在占比預范圍內、圖像像素在像素范圍內的圖像篩選出來,所述視頻數據篩選單元用于通過OpenCV庫將視頻數據按幀分割,并將圖像內容為檢測目標數據、拍攝目標占比在占比預范圍內、圖像像素在像素范圍內的每幀圖像篩選出來。
6.根據權利要求4所述的增強注意力區域生成網絡的小樣本目標檢測方法,其特征在于,所述數據清洗通過對經過數據篩選處理的圖像中重復的圖像進行清除,所述數據清洗包括以下步驟:對經過數據篩選處理的圖像進行灰度化處理;通過雙三次差值法將經過灰度化處理后的灰度圖像調整為固定的大小的灰度圖像;通過感知哈希算法對經過雙三次差值法處理后的灰度圖像進行處理,生成能代表圖像內容的感知哈希序列;比較不同圖像的感知哈希序列,將感知哈希序列相似度大于感知哈希序列相似度預設值的兩個圖像刪除其中一個。
7.根據權利要求4所述的增強注意力區域生成網絡的小樣本目標檢測方法,其特征在于,所述數據標注通過將經過數據清洗處理后的圖像輸入至基于注意力機制的圖像標注模型進行處理,所述基于注意力機制的圖像標注模型通過以下步驟獲取:通過包含ResNet101網絡結構的編碼器提取待訓練圖像的圖像特征;通過將待訓練圖像的圖像特征輸入至解碼器來生成待訓練圖像的每個像素的注意力權重,所述解碼器包括基于注意力機制的LSTM網絡和能生成指針的神經網絡;將注意力權重與待訓練圖像的圖像特征加權求得到局部視覺特征并作為所述解碼器下一時刻輸入直至解碼結束。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于溫州大學,未經溫州大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110651171.0/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種超深集水井沉井施工結構及施工方法
- 下一篇:一種高層逃生緩降裝置





