[發(fā)明專利]基于改進FasterR-CNN的復(fù)雜戰(zhàn)場環(huán)境目標高效識別方法在審
| 申請?zhí)枺?/td> | 202011171514.5 | 申請日: | 2020-10-28 |
| 公開(公告)號: | CN112417981A | 公開(公告)日: | 2021-02-26 |
| 發(fā)明(設(shè)計)人: | 王運明;彭超亮;初憲武 | 申請(專利權(quán))人: | 大連交通大學 |
| 主分類號: | G06K9/00 | 分類號: | G06K9/00;G06K9/62;G06N3/04;G06N3/08 |
| 代理公司: | 大連智高專利事務(wù)所(特殊普通合伙) 21235 | 代理人: | 蓋小靜 |
| 地址: | 116028 遼寧*** | 國省代碼: | 遼寧;21 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 基于 改進 fasterr cnn 復(fù)雜 戰(zhàn)場 環(huán)境 目標 高效 識別 方法 | ||
本發(fā)明公開了基于改進FasterR?CNN的復(fù)雜戰(zhàn)場環(huán)境目標高效識別方法,包括:構(gòu)建兩路特征提取網(wǎng)絡(luò);一路特征提取網(wǎng)絡(luò)輸出的戰(zhàn)場環(huán)境特征圖輸入候選區(qū)域生成網(wǎng)絡(luò),所述候選區(qū)域生成網(wǎng)絡(luò)通過融合淺層目標位置信息和深層高階語義特征來區(qū)分戰(zhàn)場環(huán)境中的背景與目標,采用K?Means聚類方法對戰(zhàn)場環(huán)境特征圖重新設(shè)置錨點尺寸大小以及長寬比;另一路特征提取網(wǎng)絡(luò)輸出的戰(zhàn)場環(huán)境特征圖、候選區(qū)域生成網(wǎng)絡(luò)輸出的候選區(qū)域輸入分類回歸網(wǎng)絡(luò)中,對目標進行分類識別,并對位置進行回歸。此方法在復(fù)雜戰(zhàn)場環(huán)境下,提高了戰(zhàn)場目標的準確率,使得此模型較之前的模型有更好的理論指導(dǎo)意義。
技術(shù)領(lǐng)域
本發(fā)明屬于深度學習與圖像識別領(lǐng)域,具體涉及基于改進FasterR-CNN的復(fù)雜戰(zhàn)場環(huán)境目標高效識別方法。
背景技術(shù)
復(fù)雜戰(zhàn)場環(huán)境下,無人裝備集群如何有效、準確識別戰(zhàn)場目標,是實現(xiàn)無人裝備精確控制、避障及執(zhí)行攻擊任務(wù)的關(guān)鍵,對敵方目標的識別能夠保障我方無人裝備在復(fù)雜動態(tài)戰(zhàn)場下完成偵察及作戰(zhàn)任務(wù)。傳統(tǒng)的目標識別方法主要有Cascade+HOG、DPM+Haar、SVM及其改進、優(yōu)化方法,這些方法的缺點是需要人工設(shè)計特征,工作量龐大,而且類似算法在目標形態(tài)變化大、背景復(fù)雜或者光照不足的情況下表現(xiàn)往往不佳。隨著深度學習在目標識別上的應(yīng)用,采用深層次的神經(jīng)網(wǎng)絡(luò)提取出的目標特征質(zhì)量遠遠超過傳統(tǒng)人工特征。卷積神經(jīng)網(wǎng)絡(luò)采用原始圖像作為輸入,可以有效地從大量樣本中學習到相應(yīng)特征,避免復(fù)雜的特征提取過程。
但是受復(fù)雜戰(zhàn)場目標運動速度、形狀、尺寸、姿態(tài)等內(nèi)部因素的改變和氣象環(huán)境等外部因素的影響,且無人裝備獲取的目標樣本數(shù)量較少,使得無人裝備的目標識別存在準確性低、速度慢的問題。
盡管目前已有大量用于進行目標檢測的算法,但在很多自然場景中FasterR-CNN仍是最廣泛使用的一種深度學習算法,因此,選取FasterR-CNN來進行復(fù)雜戰(zhàn)場環(huán)境目標高效識別。整個FasterR-CNN網(wǎng)絡(luò)模型主要分為特征提取網(wǎng)絡(luò)、候選區(qū)域生成網(wǎng)絡(luò)和分類回歸網(wǎng)絡(luò)3個子網(wǎng)絡(luò)部分:
所述特征提取網(wǎng)絡(luò):顧名思義就是利用卷積網(wǎng)絡(luò)提取圖像特征,它可以是任何能學習圖像特征的網(wǎng)絡(luò)結(jié)構(gòu),由于卷積網(wǎng)絡(luò)參數(shù)過多不易調(diào)參,所以一般都會采用一些已經(jīng)被廣泛使用的網(wǎng)絡(luò)結(jié)構(gòu),通常使用ZF、AlexNet、VGG16及殘差網(wǎng)絡(luò)ResNet等網(wǎng)絡(luò)模型。特征提取網(wǎng)絡(luò)所提取的特征好壞會直接影響到候選區(qū)域生成網(wǎng)絡(luò)的性能,因為生成的特征圖像將被送到候選區(qū)域生成網(wǎng)絡(luò)中進行目標分類以及目標位置回歸。特征提取網(wǎng)絡(luò)是整個卷積網(wǎng)絡(luò)的基礎(chǔ),對整個網(wǎng)絡(luò)的性能好壞起到關(guān)鍵性作用。如圖1所示,即為特征提取網(wǎng)絡(luò)的結(jié)構(gòu),僅給出與特征提取網(wǎng)絡(luò)相關(guān)部分的結(jié)構(gòu)。
所述候選區(qū)域生成網(wǎng)絡(luò):FasterR-CNN算法中的候選區(qū)域生成網(wǎng)絡(luò),即RPN網(wǎng)絡(luò),其作用是選取目標可能的候選區(qū)域并進行前景背景的判別,同時對這些區(qū)域的位置進行回歸,微調(diào)修正。該網(wǎng)絡(luò)以特征提取網(wǎng)絡(luò)生成的特征圖作為輸入,通過設(shè)定不同尺度不同長寬比例的anchor機制,并將其作用于特征圖,獲取到一定數(shù)量的目標可能的候選區(qū)域框。其本質(zhì)是使用滑動窗口算法進行候選區(qū)域的提取,通過使用卷積神經(jīng)網(wǎng)絡(luò)來實現(xiàn)。如圖2所示,即為候選區(qū)域生成網(wǎng)絡(luò)的結(jié)構(gòu),僅給出與該網(wǎng)絡(luò)相關(guān)部分的結(jié)構(gòu)。
所述分類回歸網(wǎng)絡(luò):FasterR-CNN算法中的分類回歸網(wǎng)絡(luò)輸入為候選區(qū)域及其對應(yīng)的特征圖,該子網(wǎng)絡(luò)的作用是對候選區(qū)域的前景進一步分類,確定目標的具體類別,同時對目標區(qū)域的位置再次進行回歸。然而由于目標形狀大小各異,anchor機制的設(shè)置,使得候選區(qū)域的大小形狀不盡相同,最后將映射后的特征向量分別輸入到回歸層和分類層當中,一個用于進行目標類別的判斷,一個用于進行目標位置的回歸。如圖3所示,即為分類回歸網(wǎng)絡(luò)的結(jié)構(gòu),僅給出與該網(wǎng)絡(luò)相關(guān)部分的結(jié)構(gòu)。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于大連交通大學,未經(jīng)大連交通大學許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011171514.5/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06K 數(shù)據(jù)識別;數(shù)據(jù)表示;記錄載體;記錄載體的處理
G06K9-00 用于閱讀或識別印刷或書寫字符或者用于識別圖形,例如,指紋的方法或裝置
G06K9-03 .錯誤的檢測或校正,例如,用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標記或含有代碼標記的打印字符的,例如,由不同形狀的各個筆畫組成的,而且每個筆畫表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理,即無須判定關(guān)于圖像的同一性而進行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合
- 一種基于深度學習的焊縫超聲TOFD?D掃描缺陷類型的自動識別方法
- 一種改進的FasterR?CNN人臉檢測方法
- 一種三維模型部件的自動檢測方法
- 一種基于深度神經(jīng)網(wǎng)絡(luò)的直腸癌環(huán)周切緣MRI圖像自動識別方法及系統(tǒng)
- 一種基于多模態(tài)關(guān)系的網(wǎng)絡(luò)謠言檢測方法
- 一種多特征提取網(wǎng)絡(luò)的目標檢測方法
- 基于改進FasterR-CNN的復(fù)雜戰(zhàn)場環(huán)境目標高效識別方法
- 一種基于改進FasterR-CNN的海底生物目標檢測方法
- 用于PCB電路板的檢測系統(tǒng)
- 一種基于BiRNN的行駛的非機動車匹配方法
- 圖像語義標注的設(shè)備和方法及其模型的生成方法和系統(tǒng)
- 使用卷積神經(jīng)網(wǎng)絡(luò)的數(shù)字圖像處理
- 為數(shù)據(jù)庫確定卷積神經(jīng)網(wǎng)絡(luò)CNN模型的裝置和方法
- 確定卷積神經(jīng)網(wǎng)絡(luò)CNN模型的裝置和方法
- 采用嵌入式系統(tǒng)中的小規(guī)模卷積神經(jīng)網(wǎng)絡(luò)模塊的人臉檢測
- 針對深度通道和卷積神經(jīng)網(wǎng)絡(luò)圖像和格式使用相機設(shè)備的方法和系統(tǒng)
- 處理卷積神經(jīng)網(wǎng)絡(luò)的方法
- CNN加速器和電子設(shè)備
- 一種基于混合神經(jīng)網(wǎng)絡(luò)的腦電時空特征學習與情感分類方法
- 一種基于FPGA的深度學習加速方法





