[發明專利]一種基于標注框拼接的深度學習圖像增強方法在審
| 申請號: | 202011468618.2 | 申請日: | 2020-12-14 |
| 公開(公告)號: | CN112508836A | 公開(公告)日: | 2021-03-16 |
| 發明(設計)人: | 張曉磊;華堯 | 申請(專利權)人: | 磐基技術有限公司 |
| 主分類號: | G06T5/50 | 分類號: | G06T5/50;G06T3/40;G06T7/10 |
| 代理公司: | 西安通大專利代理有限責任公司 61200 | 代理人: | 張海平 |
| 地址: | 710065 陜西省西安市*** | 國省代碼: | 陜西;61 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 標注 拼接 深度 學習 圖像 增強 方法 | ||
1.一種基于標注框拼接的深度學習圖像增強方法,其特征在于,包括以下步驟:
步驟1,選取具有需要識別的物體掩模的N張圖片,把N張圖片及其掩模縮放到相同的大小;
步驟2,對N張圖片進行隨機排序,并順序選取M張圖片;
步驟3,隨機在圖片區域范圍內選定一或者多個拼接點,拼接點將圖像區域分割成M個區域;
步驟4:在步驟3中分割的M個區域中依次選取一個區域,并把步驟2中選擇M張圖片按順序把選取的區域進行拼接,組成一張完整的新圖片;
步驟5,對步驟4組成的新圖片,使用拼接到該圖片中的掩模的大小、面積、比例、標注框內是否包含掩模條件來篩選該新圖片內的標注框;
步驟6,對于判斷無效的的標注框,進行舍棄、重新進行步驟3或對選取的圖片的拼接區域進行調整;
步驟7,重復操作步驟1至步驟5,直至完成對所有N張圖片的增強。
2.根據權利要求1所述的一種基于標注框拼接的深度學習圖像增強方法,其特征在于,步驟6中的調整為隨機產生一個新的拼接區域。
3.根據權利要求1所述的一種基于標注框拼接的深度學習圖像增強方法,其特征在于,步驟5中,篩選該新圖片內的標注框的方法包括以下方法中的一個或者多個的組合:
(1)判斷所有標注框的最小區域的面積或者最短邊是否小于閾值,如果小于,則判斷為無效標注框;
(2)獲取每一個標注框的掩模,每張圖片中所選取的待拼接部分,在圖片對應的掩模上截取相同的位置,對截取位置內的N個標注框進行依次判斷。
4.根據權利要求2所述的一種基于標注框拼接的深度學習圖像增強方法,其特征在于,方法(2)中使用以下的一種或者多種方法:
(1).判斷該標注框內是否包含該目標的掩模部分,如果完全不包含,則判斷為無效標注框;
(2).本標注框內包含本目標的掩膜的面積,面積小于閾值的舍棄或者返回步驟3;
(3).計算該標注框內其包含的本目標的掩模與全部掩模面積之間的比例,對于小于閾值的標注框判斷為無效標注框;
(4).設置一個閾值,當拼接點到該掩模邊緣的最短距離小于一個閾值,或認為裁剪的圖像不能代表該物體的特征,判斷為無效標注框。
5.根據權利要求3所述的一種基于標注框拼接的深度學習圖像增強方法,其特征在于,步驟6中,所述對選取的圖片的拼接區域進行調整,是通過對該區域在原圖中的位置進行平移來獲取有效標注框,移動方式為在原圖片中該區域相對于圖內的拼接點的反方向進行移動,移動閾值的距離。
6.根據權利要求1所述的一種基于標注框拼接的深度學習圖像增強方法,其特征在于,步驟3中,拼接點的選取范圍限制在圖片的寬和高尺寸之比為0.2~0.8內。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于磐基技術有限公司,未經磐基技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011468618.2/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種電力自動控制裝置
- 下一篇:一種機械式連續作業挖蒜裝置





