[發明專利]一種自適應確定目標尺寸和感受野大小的方法有效
| 申請號: | 202110449343.6 | 申請日: | 2021-04-25 |
| 公開(公告)號: | CN113378876B | 公開(公告)日: | 2022-11-15 |
| 發明(設計)人: | 許雯;孟朝暉 | 申請(專利權)人: | 河海大學 |
| 主分類號: | G06V10/70 | 分類號: | G06V10/70;G06N3/04;G06N3/08 |
| 代理公司: | 南京經緯專利商標代理有限公司 32200 | 代理人: | 羅運紅 |
| 地址: | 210000 江*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 自適應 確定 目標 尺寸 感受 大小 方法 | ||
本發明公開了一種自適應確定目標尺寸和感受野大小的方法,包括如下步驟:S1:定義九個候選框尺寸,計算真實目標框與候選框的交集面積,與它們的并集面積比,得到一個面積比值;S2:根據得到的候選框,計算出正候選框與真實框之間的偏移量offset與縮放因子(sx,sy);S3:從正候選框中選出得分最高的k個候選框(k表示圖片中目標的個數),再進行一次面積計算,大于給定閾值的視為該正候選框與得分最高的其中一個候選框表示同一個目標故去掉。本發明在保證高運算效率以及低內存占有率的情況下保證了圖像目標框的結果,通過RGB顏色差值的對比來進行分割,每個圖片包含的像素點均有最大限制,保證了每張圖片產生九×高×寬個候選框,保證了計算運行的效率。
技術領域
本發明涉及一種自適應確定目標尺寸和感受野大小的方法,屬于計算機視覺和模式識別領域。
背景技術
圖片是由W×H×3的像素點組成,其中W、H是圖片的寬和高,3代表由紅、綠、藍組成3通道的顏色,(x,y,rbg)代表圖片中的任意一點,(x,y)是位置坐標,rbg為該位置的顏色。
目標檢測分為兩類,一類是two-stage,將物體識別和定位分為兩個步驟,例如R-CNN、Fast R-CNN、Faster R-CNN;另一類是one-stage,適用于實時檢測,例如Yolo、SDD、YoloV2。第一類準確度更高,但速度慢一些,第二類速度更快,但沒有two-stage精確。本發明則是屬于第一類two-stage。
傳統卷積網絡的卷積核都是固定大小的尺寸,不能很好的適應幾何形變,可變形卷積網絡在位置坐標中加了一個偏移量Δp,能夠自適應學習改變提取框的形狀和位置,但是由于多加了一個訓練參數,將會導致訓練速度低下,為了提升網絡的訓練速度,減小資源消耗。
RPN(區域候選網絡),本質上是基于過濾器的無差別object檢測。RPN的輸入特征圖是Faster RCNN的公用特征圖Feature map,取一個a*a的滑動窗口,對特征圖中的k個候選框做卷積操作,根據每個候選框的得分和位置坐標來修改提取框,確定目標中心。而日常生活中大多數是不規則物體,矩形提取框不能很好描述目標。
本發明受可變形卷積網絡啟發,在基礎RPN的提取框上進行改進。需要對Featuremap提取幾個候選框,在候選框中的每個位置增加一個偏移量,經過學習候選框則會移動到目標位置,候選框也會形成目標形狀。以上網絡的實現如果采用傳統網絡的輸入矩陣與權值矩陣的乘積,因為增加了的一個位置參數,而使得計算量巨大。所以這里我們采用加法網絡代替乘法網絡,精度損失非常小,但速度提升一個量級。
發明內容
發明目的:本發明旨在使用加法網絡提升two-stage目標檢測的速度,使提取框更準確的描述目標。
技術方案:為實現本發明的目的,本發明所采用的技術方案是:一種自適應確定目標尺寸和感受野大小的方法,該方法包括如下步驟:
Step1:對原始分辨率448*256的圖片進行ResNet-50網絡卷積操作提取特征圖featuremaps,將卷積中的乘法換成加法操作,具體操作如下:
其中,Y(m,n,t)表示輸出坐標為(m,n)第t個通道的值,X(m+i,n+j,k)表示輸入坐標為(m+i,n+j)的第k個通道的值,cin為原始輸入圖片的通道,F(i,j,k,t)是過濾器,也為權值矩陣,過濾器大小為d*d,經過ResNet-50網絡卷積得到28*16*256的特征圖,用于區域候選框提取RPN和感興趣區域池化ROIPooling共享;
Step2:定義九個邊界框尺寸,候選框尺寸如下:
{[2,2],[2,4],[2,8],[4,2],[4,4],[4,8],[8,2],[8,4],[8,8]};
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于河海大學,未經河海大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110449343.6/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種生物肥料施肥系統
- 下一篇:一種直接3D打印的復合功能材料及打印方法





