[發明專利]一種用于對金字塔特征圖進行預測的算法在審
| 申請號: | 202011069030.X | 申請日: | 2020-09-30 |
| 公開(公告)號: | CN112183649A | 公開(公告)日: | 2021-01-05 |
| 發明(設計)人: | 楊淑愛;陳俊杰;李澤輝 | 申請(專利權)人: | 佛山市南海區廣工大數控裝備協同創新研究院;佛山市廣工大數控裝備技術發展有限公司 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62;G06K9/54;G06N3/04;G06Q10/04;G06T3/40;G06T7/73 |
| 代理公司: | 廣東廣信君達律師事務所 44329 | 代理人: | 江金城 |
| 地址: | 528225 *** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 用于 金字塔 特征 進行 預測 算法 | ||
本發明公開了一種用于對金字塔特征圖進行預測的算法,包括:選取和劃分數據集,并對數據集的輸入的圖片進行預處理操作;對類FCOS的網絡架構的head部分進行修改并設為新網絡結構;將輸入數據送入backbone網絡中獲取輸入數據的特征圖,在特征圖的每一點上面進行回歸操作,進行網絡訓練獲取網絡模型;將預訓練的網絡模型應用到測試圖片中,從特征金字塔的多個Head中獲得預測的結果;本發明通過對其中預測網絡部分的head網絡采用輕量級簡易的模型改進,得到不同層次上特征圖的預測結果,再對金字塔特征圖不同層次上的預測結果進行結合,得到最后預測結果,其準確率比起當前目標檢測領域的SOAT方法有顯著提升。
技術領域
本發明涉及圖像處理技術領域,尤其涉及一種用于對金字塔特征圖進行預測的算法。
背景技術
近年來,由于卷積神經網絡(簡稱CNN)的發展和應用,許多計算機視覺領域的任務得到了較大的發展,其中目標檢測的是計算機視覺中的一項重要的任務。目標檢測是計算機視覺和數字圖像處理的一個熱門方向,廣泛應用于機器人導航、智能視頻監控、工業檢測、航空航天等諸多領域,通過計算機視覺減少對人力資本的消耗,具有重要的現實意義。因此,目標檢測也就成為了近年來理論和應用的研究熱點,它是圖像處理和計算機視覺學科的重要分支,也是智能監控系統的核心部分,同時目標檢測也是泛身份識別領域的一個基礎性的算法,對后續的人臉識別、步態識別、人群計數、實例分割等任務起著至關重要的作用。由于深度學習的廣泛運用,目標檢測算法得到了較為快速的發展,基于深度學習的兩種目標檢測算法思路,分別為One-Stage目標檢測算法和Two-Stage目標檢測算法。
目前主流的目標檢測算法主要是基于深度學習模型,大概可以分成兩大類別:(1)One-Stage目標檢測算法,這類檢測算法不需要產生候選區域框的階段,可以通過一個Stage直接產生物體的類別概率和位置坐標值,比較典型的算法有YOLO、SSD和CornerNet;(2)Two-Stage目標檢測算法,這類檢測算法將檢測問題劃分為兩個階段,第一個階段首先產生候選區域(Region Proposals),包含目標大概的位置信息,然后第二個階段對候選區域進行分類和位置精修,這類算法的典型代表有R-CNN,Fast R-CNN,Faster R-CNN等。目標檢測模型的主要性能指標是檢測準確度和速度,其中準確度主要考慮物體的定位以及分類準確度。一般情況下,Two-Stage算法在準確度上有優勢,而One-Stage算法在速度上有優勢。不過,隨著研究的發展,兩類算法都在兩個方面做改進,均能在準確度以及速度上取得較好的結果。在申請研究的目標檢測算法是基于One-Stage的,它針對近來很熱門的密集目標檢測器,其準確率比起目前最先進的算法都有所提升。滑動窗口目標檢測器,它在密集且規則的網格上生成邊界框預測,在現代物體檢測中起著至關重要的作用。目前這種檢測器大多都是基于限定框的一個點去進行預測的,這樣得到的特征可能不具有代表性,所以后面有人提出通過引入更多更強的特征,但很多這些增加的操作會由于引入了背景噪聲帶來有害的信息。然而這些方法沒有顯式地提取邊界特征,本申請認為邊界極限點特征對邊界框的定位比較重要,并且在每個邊界處選取最有效的特征,用簡潔高效的方法來完成特征的提取,因此,現有技術需要進一步改進和完善。
發明內容
本發明的目的在于克服現有技術的不足,提供一種用于對金字塔特征圖進行預測的算法。
本發明的目的通過下述技術方案實現:
一種用于對金字塔特征圖進行預測的算法,該算法主要包括如下具體步驟:
步驟S1:選取和劃分數據集,并對數據集的輸入的圖片進行預處理操作。
進一步的,所述S1步驟還包括:
步驟S11:采用當前較為流行的COCO目標檢測類別數據集,按照常規的做法,訓練集采用COCO trainval35k set(115K images),驗證集采用COCO minival set(5Kimages),測試集采用test-dev set(20K images)。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于佛山市南海區廣工大數控裝備協同創新研究院;佛山市廣工大數控裝備技術發展有限公司,未經佛山市南海區廣工大數控裝備協同創新研究院;佛山市廣工大數控裝備技術發展有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011069030.X/2.html,轉載請聲明來源鉆瓜專利網。





