[發(fā)明專利]一種基于檢測框密度優(yōu)化的目標(biāo)檢測應(yīng)用方法在審
| 申請?zhí)枺?/td> | 202010567120.5 | 申請日: | 2020-06-19 |
| 公開(公告)號: | CN113205106A | 公開(公告)日: | 2021-08-03 |
| 發(fā)明(設(shè)計)人: | 李至善;賈寶芝;何一凡 | 申請(專利權(quán))人: | 深圳瑞為智能科技有限公司 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62;G06N3/04;G06N3/08 |
| 代理公司: | 深圳勝博時代專利代理事務(wù)所(普通合伙) 44506 | 代理人: | 黃海艷 |
| 地址: | 518100 廣東省深圳市南山*** | 國省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 檢測 密度 優(yōu)化 目標(biāo) 應(yīng)用 方法 | ||
本發(fā)明公開一種基于檢測框密度優(yōu)化的目標(biāo)檢測應(yīng)用方法。包括S1、收集訓(xùn)練數(shù)據(jù);S2、數(shù)據(jù)集預(yù)處理;S3、訓(xùn)練目標(biāo)檢測網(wǎng)絡(luò)模型;S4、框的密度計算;S5、密度過濾。本發(fā)明對于每一個檢測框進(jìn)行全新的密度變量定義,在NMS算法處理過程中,借助密度定義所產(chǎn)生的數(shù)值,以及依據(jù)誤檢物體停留時間較短,所存在檢測框的數(shù)量也較少,從而其檢測框的密度也隨之較小,從而在NMS算法中,利用閾值的設(shè)定,丟棄一些密度較小的框,從而在不改變原始模型的基礎(chǔ)上大大減少誤檢的數(shù)量,獲得更為舒適的體驗。
技術(shù)領(lǐng)域
本發(fā)明涉及基于深度學(xué)習(xí)方法的計算機(jī)視覺領(lǐng)域,尤其是一種基于檢測框密度優(yōu)化的目標(biāo)檢測應(yīng)用方法。
背景技術(shù)
深度學(xué)習(xí)技術(shù)在近年來迎來了井噴式的發(fā)展,其中基于深度學(xué)習(xí)的計算機(jī)視覺領(lǐng)域的發(fā)展尤為顯著。目標(biāo)檢測是計算機(jī)視覺領(lǐng)域最基本的任務(wù)之一,學(xué)術(shù)界也有很多年的研究歷史。目標(biāo)檢測不單單要識別出是什么,還要定位圖像的位置。目標(biāo)檢測技術(shù)在工業(yè)界有很重要的作用,還在安防、自動駕駛、醫(yī)療方面起到重要的推動作用。
但目標(biāo)檢測過程中有很多不確定的因素,包括同一類物體的不同應(yīng)用場景,不同姿態(tài)外觀等都會產(chǎn)生一定的干擾。所以目標(biāo)檢測算法進(jìn)行落地有一定的難度。目前各種復(fù)雜的網(wǎng)絡(luò)模型層出不窮,但受限于計算能力的限制以及實時性的要求。實際的應(yīng)用場景中多以簡單高效的輕量化模型為主,但在實際場景中,其效果還有很大的提升空間。主要體現(xiàn)在誤檢過多。也即通過增大檢出來減少漏檢的時候,誤檢也會隨之增多。在實際的應(yīng)用中,誤檢過多帶來的問題就是效率極其低下。
在實際的連續(xù)幀檢測中,誤檢的存在是不穩(wěn)定的。也即在連續(xù)的幾幀中,某一幀可能會誤檢背景為物體,下一幀誤檢框可能就會消失,非常的不穩(wěn)定。而正檢則是非常穩(wěn)定的存在著,直到物體完全消失都一直存在著。本發(fā)明以這種現(xiàn)象為基礎(chǔ),提出了一種基于框的密度的過濾方法去除誤檢。
發(fā)明內(nèi)容
針對上述現(xiàn)有技術(shù)中存在的不足,本發(fā)明的目的在于提供一種利用檢測框的密度特征進(jìn)行誤檢的過濾,從而大大減少誤檢,優(yōu)化神經(jīng)網(wǎng)絡(luò)的表達(dá)效果的目標(biāo)檢測應(yīng)用方法。
為了實現(xiàn)上述目的,本發(fā)明采用如下技術(shù)方案:
一種基于檢測框密度優(yōu)化的目標(biāo)檢測應(yīng)用方法,包括以下步驟:
S1、收集訓(xùn)練數(shù)據(jù),提前收集好標(biāo)注完成的圖像數(shù)據(jù);
S2、數(shù)據(jù)集預(yù)處理,將圖像數(shù)據(jù)進(jìn)行調(diào)整,所述調(diào)整包括擴(kuò)增數(shù)據(jù)、增強(qiáng)模型的擬合能力以及過濾無用數(shù)據(jù);
S3、訓(xùn)練目標(biāo)檢測網(wǎng)絡(luò)模型,進(jìn)行不少于200 Epoch的迭代,同時需適時地調(diào)整學(xué)習(xí)率讓模型收斂,等到模型收斂的時候在測試集上進(jìn)行精度的測試,直至滿足需求;
S4、框的密度計算,首先將每一個檢測框的框位由框的幾何中心點來表示,然后對每一個檢測框定義一個敏感區(qū)域,所述敏感區(qū)域的圓心即是對應(yīng)檢測框的幾何中心點,而直徑則是檢測框的長寬兩邊匯總較短邊,每一個檢測框都存在其敏感區(qū)域和中心點,每個檢測框的密度定義為同種類別檢測框且中心點在此檢測框的敏感區(qū)域的框的個數(shù);
S5、密度過濾,進(jìn)行NMS算法過濾,優(yōu)先設(shè)置合適密度篩選閾值,統(tǒng)計每一個檢測框的密度,在NMS算法過程中保留密度大于密度篩選閾值,丟棄密度較小的檢測框,最終輸出結(jié)果。
優(yōu)選地,所述收集訓(xùn)練數(shù)據(jù)步驟中的圖像數(shù)據(jù)標(biāo)注格式為Pascal VOC或者M(jìn)SCOCO。
優(yōu)選地,所述訓(xùn)練目標(biāo)檢測網(wǎng)絡(luò)模型步驟中,若精度較差,不符合需求,則調(diào)整原始網(wǎng)絡(luò)的復(fù)雜度和參數(shù)量,隨后再次進(jìn)行訓(xùn)練,直至滿足需求。
優(yōu)選地,在連續(xù)幀下進(jìn)行檢測時,將模型遷移至實際的攝像頭的前端中,對攝像頭的每幀數(shù)據(jù)進(jìn)行步驟S1-S5進(jìn)行推理。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于深圳瑞為智能科技有限公司,未經(jīng)深圳瑞為智能科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010567120.5/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06K 數(shù)據(jù)識別;數(shù)據(jù)表示;記錄載體;記錄載體的處理
G06K9-00 用于閱讀或識別印刷或書寫字符或者用于識別圖形,例如,指紋的方法或裝置
G06K9-03 .錯誤的檢測或校正,例如,用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標(biāo)記或含有代碼標(biāo)記的打印字符的,例如,由不同形狀的各個筆畫組成的,而且每個筆畫表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理,即無須判定關(guān)于圖像的同一性而進(jìn)行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合





