[發(fā)明專利]一種基于多尺度匹配策略深度特征學習的目標檢測方法在審
| 申請?zhí)枺?/td> | 202010564966.3 | 申請日: | 2020-06-19 |
| 公開(公告)號: | CN111723737A | 公開(公告)日: | 2020-09-29 |
| 發(fā)明(設計)人: | 董永生;張智勇;吳慶濤;裴遠樺;鄭博士;蔣志強;劉晴;譚偉;鄭林濤;王琳 | 申請(專利權)人: | 河南科技大學 |
| 主分類號: | G06K9/00 | 分類號: | G06K9/00;G06K9/34;G06K9/62;G06N3/04;G06N3/08 |
| 代理公司: | 洛陽公信知識產(chǎn)權事務所(普通合伙) 41120 | 代理人: | 宋晨煒 |
| 地址: | 471000 河*** | 國省代碼: | 河南;41 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 尺度 匹配 策略 深度 特征 學習 目標 檢測 方法 | ||
一種基于多尺度匹配策略深度特征學習的目標檢測方法,基于殘差神經(jīng)網(wǎng)絡,我們首先對不同類目標的寬高比進行聚類,并進一步使用多尺度匹配策略來選擇默認框,緩解目標遮擋問題。然后,融合不同深度的特征圖以檢測不同尺度的物體。實驗結果表明,與當前九種具有代表性的目標檢測方法相比,我們提出的方法更具競爭力,速度更快,精度更高。
技術領域
本發(fā)明涉及計算機視覺和模式識別技術領域,,具體說的是一種基于多尺度匹配策略深度特征學習的目標檢測方法。
背景技術
目標檢測是從圖像或視頻中找到感興趣的目標。人們的視覺系統(tǒng)可以從圖像或視頻中快速準確地捕捉到目標類型、位置以及各目標之間的相對關系。它可以幫助我們完成一些復雜的任務,例如運動和駕駛汽車。在過去的幾十年中,多種目標檢測算法已經(jīng)被提出,它們可以分為兩類:傳統(tǒng)的目標檢測算法和基于深度學習的目標檢測算法。
早期的目標檢測算法主要基于手動構建的特征。由于當時缺乏有效的可視化技術,人們只能設計復雜的特征表示并不斷對其進行優(yōu)化。基于深度學習的方法,通過不斷加深網(wǎng)絡的深度讓計算機自動提取特征,不需要復雜的特征表示,從而在近些年不斷刷新計算機視覺領域的各項記錄。
但是,這兩種方法都不能很好的檢測小目標以及被遮擋的目標。
發(fā)明內(nèi)容
為解決上述技術問題,本發(fā)明提供一種基于多尺度匹配策略深度特征學習的目標檢測方法,速度更快,精度更高。
為實現(xiàn)上述技術目的,所采用的技術方案是:一種基于多尺度匹配策略深度特征學習的目標檢測方法,包括以下步驟:
步驟一:聚類目標寬高比,劃分單元格
首先對數(shù)據(jù)集中所有具有真實框的被檢測目標按照類別對寬高比進行聚類,得到所有類別默認框的寬高比信息,隨后將數(shù)據(jù)集中每一張整幅圖像按S*S個單元格進行劃分,13≤S≤26;
步驟二:多尺度匹配默認框,學習偏移量,得到預測框
計算被檢測目標的中心坐標,提取其所在單元格的直實框信息,將所有默認框依次與被檢測目標的真實框進行比對,選擇具有最大IoU值的默認框,并按照以下公式計算偏移量,得到預測框;
bx=cx+px
by=cy+py
bf=p(b,obj)*pf
其中,bx,by,bw,bh,bf分別表示預測框的橫坐標、縱坐標、寬、高以及包含目標的自信度,px,py,pw,ph,pf分別表示殘差神經(jīng)網(wǎng)絡輸出的橫坐標、縱坐標、寬、高的偏移量和自信度,cx,cy,cw,ch分別表示默認框的橫坐標、縱坐標、寬和高,p(b,obj)為示性函數(shù),當輸出的pf高于閾值t時,0.5≤t≤0.7, p(b,obj)為1,否則為0;
步驟三:多深度特征融合,檢測多尺度目標
對整個殘差神經(jīng)網(wǎng)絡的多個深度提取特征并進行融合后,并對整個殘差神經(jīng)網(wǎng)絡的進行優(yōu)化,對步驟二得到的預測框與真實框使用均方誤差進行誤差計算;
步驟四:進行訓練
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于河南科技大學,未經(jīng)河南科技大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010564966.3/2.html,轉載請聲明來源鉆瓜專利網(wǎng)。
- 上一篇:一種基于虹膜識別的車輛控制裝置及使用方法
- 下一篇:用藥依從性管理方法和裝置





