[發(fā)明專利]針對霧天條件下的目標檢測方法和裝置在審
| 申請?zhí)枺?/td> | 202010832364.1 | 申請日: | 2020-08-18 |
| 公開(公告)號: | CN111814753A | 公開(公告)日: | 2020-10-23 |
| 發(fā)明(設(shè)計)人: | 陳海波;羅志鵬;徐振宇 | 申請(專利權(quán))人: | 深延科技(北京)有限公司 |
| 主分類號: | G06K9/00 | 分類號: | G06K9/00;G06K9/36;G06K9/46;G06K9/62;G06N3/04 |
| 代理公司: | 常州佰業(yè)騰飛專利代理事務(wù)所(普通合伙) 32231 | 代理人: | 陳紅橋 |
| 地址: | 100081 北京市海淀*** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 針對 天條 目標 檢測 方法 裝置 | ||
1.一種針對霧天條件下的目標檢測方法,其特征在于,包括以下步驟:
獲取包含多個霧天圖像的原始數(shù)據(jù)集,并對所述原始數(shù)據(jù)集中的霧天圖像進行增強處理;
通過去霧算法對所述原始數(shù)據(jù)集中增強后的霧天圖像進行去霧操作,以得到去霧數(shù)據(jù)集;
構(gòu)建神經(jīng)網(wǎng)絡(luò),其中,所述神經(jīng)網(wǎng)絡(luò)包括特征提取網(wǎng)絡(luò)和預(yù)測網(wǎng)絡(luò),所述特征提取網(wǎng)絡(luò)包括可變形卷積網(wǎng)絡(luò)和特征金字塔網(wǎng)絡(luò),所述預(yù)測網(wǎng)絡(luò)包括第一階段網(wǎng)絡(luò)和第二階段網(wǎng)絡(luò),所述第二階段網(wǎng)絡(luò)包含雙分支結(jié)構(gòu);
通過增強處理后的原始數(shù)據(jù)集和所述去霧數(shù)據(jù)集對所述神經(jīng)網(wǎng)絡(luò)進行訓(xùn)練,以得到目標檢測模型;
通過所述目標檢測模型對待檢測霧天圖像進行目標檢測。
2.根據(jù)權(quán)利要求1所述的針對霧天條件下的目標檢測方法,其特征在于,對所述原始數(shù)據(jù)集中的霧天圖像進行增強處理,包括:
對所述原始數(shù)據(jù)集中的霧天圖像進行隨機翻轉(zhuǎn)、隨機剪裁操作。
3.根據(jù)權(quán)利要求2所述的針對霧天條件下的目標檢測方法,其特征在于,所述去霧算法為FFANet。
4.根據(jù)權(quán)利要求1-3中任一項所述的針對霧天條件下的目標檢測方法,其特征在于,所述特征提取網(wǎng)絡(luò)為ResNeXt,所述第一階段網(wǎng)絡(luò)為RPN,所述第二階段網(wǎng)絡(luò)為Cascade RCNN。
5.根據(jù)權(quán)利要求4所述的針對霧天條件下的目標檢測方法,其特征在于,通過增強處理后的原始數(shù)據(jù)集和所述去霧數(shù)據(jù)集對所述神經(jīng)網(wǎng)絡(luò)進行訓(xùn)練,包括:
將所述原始數(shù)據(jù)集中的霧天圖像或所述去霧數(shù)據(jù)集中的去霧后圖像輸入ResNeXt,經(jīng)過stage2輸出特征圖F2,將F2輸入可變形卷積網(wǎng)絡(luò)輸出特征圖Fd_2,將Fd_2經(jīng)過stage3輸出特征圖F3,將F3輸入可變形卷積網(wǎng)絡(luò)輸出特征圖Fd_3,將Fd_3經(jīng)過stage4輸出特征圖F4,將F4輸入可變形卷積網(wǎng)絡(luò)輸出特征圖Fd_4,將Fd_4經(jīng)過stage5輸出特征圖F5,將F5輸入可變形卷積網(wǎng)絡(luò)輸出特征圖Fd_5,其中,F(xiàn)2、F3、F4和F5構(gòu)成特征金字塔網(wǎng)絡(luò),之后,將F5上采樣2倍,并與F4執(zhí)行相加操作形成特征圖P4;將P4上采樣2倍,并與F3執(zhí)行相加操作形成特征圖P3;將P3上采樣2倍,并與F2進行相加操作形成特征圖P2;將P2上采樣2倍,并與F1執(zhí)行相加操作形成特征圖P1;
將特征圖P1、P2、P3、P4分別送入兩階段預(yù)測網(wǎng)絡(luò)中,第一階段網(wǎng)絡(luò)N1分別預(yù)測n個anchor的前景背景得分信息,以及回歸偏移量信息,通過篩選前景得分中大于某個閾值Threshold的anchor,并且根據(jù)偏移量對其執(zhí)行回歸操作后,得到置信度較高的候選框,經(jīng)過NMS操作去重后,獲得較為準確的候選框proposal作為第二階段網(wǎng)絡(luò)N2的基準框,之后,將這些不同大小的基準框映射到feature map上,然后對feature map進行采樣操作ROI Pooling將不同大小的feature采樣為相同大小的feature送入第二階段網(wǎng)絡(luò)N2中;
第二階段網(wǎng)絡(luò)N2包含三個級聯(lián)網(wǎng)絡(luò)Head1、Head2、Head3,將經(jīng)過ROI Pooling后的feature首先送入Head1網(wǎng)絡(luò)中,Head1網(wǎng)絡(luò)分別對第一階段產(chǎn)生的proposal預(yù)測類別值category1和回歸偏移量offset1,經(jīng)過category1篩選和偏移量offset1回歸之后,生成第一級網(wǎng)絡(luò)Head1中的目標框bounding box1;將bounding box1和經(jīng)過ROI Pooling后的feature送入Head2網(wǎng)絡(luò)中,Head2網(wǎng)絡(luò)分別對bounding box1預(yù)測類別值category2和回歸偏移量offset2,經(jīng)過category2篩選和偏移量offset2回歸之后,生成第二級網(wǎng)絡(luò)Head2中的目標框bounding box2;將bounding box2和經(jīng)過ROI Pooling后的feature送入Head3網(wǎng)絡(luò)中,Head3網(wǎng)絡(luò)分別對bounding box2預(yù)測類別值category3和回歸偏移量offset3,經(jīng)過category3篩選和偏移量offset3回歸之后,生成第三級網(wǎng)絡(luò)中的目標框bounding box3,即最終預(yù)測結(jié)果框。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于深延科技(北京)有限公司,未經(jīng)深延科技(北京)有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010832364.1/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06K 數(shù)據(jù)識別;數(shù)據(jù)表示;記錄載體;記錄載體的處理
G06K9-00 用于閱讀或識別印刷或書寫字符或者用于識別圖形,例如,指紋的方法或裝置
G06K9-03 .錯誤的檢測或校正,例如,用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標記或含有代碼標記的打印字符的,例如,由不同形狀的各個筆畫組成的,而且每個筆畫表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理,即無須判定關(guān)于圖像的同一性而進行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合





