[發明專利]深度學習大尺寸圖片訓練檢測算法有效
| 申請號: | 201810987195.1 | 申請日: | 2018-08-28 |
| 公開(公告)號: | CN109117892B | 公開(公告)日: | 2021-07-27 |
| 發明(設計)人: | 江南;李怡然;張海濱;黃毅標;孔令一;黃超;張貞純;賴必貴 | 申請(專利權)人: | 國網福建省電力有限公司福州供電公司;國網福建省電力有限公司;廈門億力吉奧信息科技有限公司 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62 |
| 代理公司: | 福州元創專利商標代理有限公司 35100 | 代理人: | 蔡學俊 |
| 地址: | 350009 福建省福州*** | 國省代碼: | 福建;35 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 深度 學習 尺寸 圖片 訓練 檢測 算法 | ||
本發明涉及一種深度學習大尺寸圖片訓練檢測算法。在訓練集合VOC中篩選出包含待識別對象的圖片,并保存到訓練集合VOC中的對應目錄中;遍歷所有圖片對應的標簽文件獲取對應的分類識別框,識別框用冒泡方式獲取待識別對象的最大尺度,同時用冒泡法找出待識別對象的最小尺度;以待識別對象在相應圖片中的中心坐標為中心,根據最大尺度W1、H1從相應圖片里面截取以W1、H1為最大長寬的圖片;將截取的圖片及對應的新的標簽文件替換原圖及原圖對應的標簽文件保存到訓練集合VOC中的對應目錄中;將得到的訓練集合VOC輸入到fpn深度學習網絡進行訓練。本發明算法可以訓練多個尺度,并且可以對大尺寸進行檢測,并降低內存消耗。
技術領域
本發明涉及一種深度學習大尺寸圖片訓練檢測算法。
背景技術
opencv 是開源的OpenCV是一個基于BSD許可(開源)發行的跨平臺計算機視覺庫,可以運行在Linux、Windows、Android和Mac OS操作系統上。
Fpn (Feature Pyramid Networks)特征金字塔是在深度學習網絡上的一種多尺度提取識別特征的架構。
目前的opencv算法逐步被深度學習算法所取代,但是還有一些領域像車牌識別還是基于opencv的識別技術。Opecv對于大尺寸的識別采用縮小或者采用滑框方式進行識別。
基于深度學習神經元網絡的算法對大圖片的識別或者訓練通常在進入網絡后進行縮放,設置最長邊或者最短邊,受限深度學習的gpu顯卡的內存限制通常無法識別或者訓練大尺寸原圖(5k+)。
opencv算法對于大尺寸識別采取滑框方式,但是對于不同尺度的對象識別沒有比較好的處理方法,即無法識別尺寸發生變化的圖片。
基于深度學習神經元網絡的算法對大圖片的識別或者訓練通常在進入網絡后進行縮?。ㄔO置最長邊或者最短邊),但是受限深度學習的gpu顯卡的內存(6g-12g)限制通常無法識別或者訓練大尺寸原圖(5k+),縮小導致對于細小特征的訓練和識別產生問題。特別5k的圖片特征在60x60左右,整體縮小到1024x1024后,特征只剩下12*12的區域,特征嚴重丟失,影響訓練和學習。
因此本申請針對以上現有技術的缺陷,特提出一種改造算法,可以訓練多個尺度,并且可以對大尺寸進行檢測,并降低內存消耗。
發明內容
本發明的目的在于提供一種深度學習大尺寸圖片訓練檢測算法,可以訓練多個尺度,并且可以對大尺寸進行檢測。
為實現上述目的,本發明的技術方案是:一種深度學習大尺寸圖片訓練檢測算法,包括如下步驟:
步驟S1、在訓練集合VOC中篩選出包含待識別對象的圖片,以形成包含待識別對象的圖片的圖片集合,并保存到訓練集合VOC中的對應目錄中;
步驟S2、包含待識別對象的圖片的圖片集合中的每一張圖片均對應有相應的標簽文件,每一個標簽文件均包括待識別對象的類別信息、待識別對象在相應圖片中的位置信息;遍歷所有的標簽文件獲取對應的分類識別框,識別框用冒泡方式獲取待識別對象的最大尺度(W1,H1),同時用冒泡法找出待識別對象的最小尺度(W0,H0);其中:
W1或W0=xmax-xmin
H1或H0=ymax-ymin
式中,(xmin,ymin)(xmax,ymax)分別為待識別對象在相應圖片中的左上角坐標、右下角坐標;
步驟S3、計算待識別對象在相應圖片中的中心坐標((xmax -xmin)/2,(ymax -ymin)/2));
步驟S4、以待識別對象在相應圖片中的中心坐標為中心,根據最大尺度 W1、H1從相應圖片里面截取以W1、H1為最大長寬的圖片;若截取出來的長寬落到原圖外面,則落到原圖外面部分補上空白;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于國網福建省電力有限公司福州供電公司;國網福建省電力有限公司;廈門億力吉奧信息科技有限公司,未經國網福建省電力有限公司福州供電公司;國網福建省電力有限公司;廈門億力吉奧信息科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810987195.1/2.html,轉載請聲明來源鉆瓜專利網。





