[發明專利]基于深度學習人物圖像自動分割方法、信息數據處理終端在審
| 申請號: | 201910144508.1 | 申請日: | 2019-02-27 |
| 公開(公告)號: | CN110008832A | 公開(公告)日: | 2019-07-12 |
| 發明(設計)人: | 楊剛;李肖;師夏珍 | 申請(專利權)人: | 西安電子科技大學 |
| 主分類號: | G06K9/00 | 分類號: | G06K9/00 |
| 代理公司: | 西安長和專利代理有限公司 61227 | 代理人: | 黃偉洪 |
| 地址: | 710071 陜西省*** | 國省代碼: | 陜西;61 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 人物圖像 神經網絡模型 信息數據處理 訓練數據集 人物圖片 神經網絡 自動分割 第一級 構建 可用 掩碼 分割 終端 圖像背景分割 圖像處理技術 訓練數據集合 背景替換 背景圖片 人物特征 人物照片 圖像語義 自動化 合成 篩選 圖像 模糊 學習 圖片 | ||
1.一種基于深度學習人物圖像自動分割方法,其特征在于,所述基于深度學習人物圖像自動分割方法收集人物圖片,形成訓練數據集合;構建第一級圖像語義分割的深度神經網絡模型;將收集到的訓練數據集輸入第一級深度神經網絡,生成trimap;構建第二級深度神經網絡模型;將收集到的訓練數據集及得到的trimap一起輸入第二級深度神經網絡,生成分割好的人物掩碼圖片;將人物掩碼圖片與人物原圖合成,得到分割好的人物圖片。
2.如權利要求1所述的基于深度學習人物圖像自動分割方法,其特征在于,所述基于深度學習人物圖像自動分割方法具體包括:
第一步,收集人物圖片,檢測圖片中人臉所在位置并記錄,標注每張圖片中人體區域和背景區域,生成對應的掩碼圖片,形成訓練數據集合;
第二步,構建第一級圖像語義分割的深度神經網絡模型,輸入為人物圖片和人臉所在位置,輸出為包含前景區域、背景區域、不確定區域的trimap;
第三步,將收集到的訓練數據集輸入第一級深度神經網絡,部署訓練得到第一級神經網絡模型,生成trimap;
第四步,構建第二級深度神經網絡模型,輸入為trimap,輸出為分割好的人物掩碼圖片;
第五步,將收集到的訓練數據集及得到的trimap一起輸入第二級深度神經網絡,部署訓練得到第二級神經網絡模型,生成分割好的人物掩碼圖片;
第六步,將人物掩碼圖片與人物原圖合成,得到分割好的人物圖片。
3.如權利要求2所述的基于深度學習人物圖像自動分割方法,其特征在于,所述第一步的訓練數據集合的形成過程具體為:
(1)對采集照片初步處理:對采集到的人物照片調整尺寸至600*800*3;
(2)標注圖片,對于每一張訓練樣本圖片,對于圖片中完整出現的人物頭部,標注人物頭部中心位置,并將每個人的身體用輪廓線標注出來,保存到一個文本信息中;
(3)生成圖片對應的掩碼圖片,生成一張和樣本圖片長寬相同即600*800*1大小的像素值全為0的二值掩碼圖片,從(2)中生成的文本文件中讀取上述標注的人物頭部中心位置以及人體輪廓線,并映射到該掩碼圖片上,并將人體部分的所有像素值全設為1,處理后的掩碼圖片即為原圖片的標簽。
4.如權利要求2所述的基于深度學習人物圖像自動分割方法,其特征在于,所述第二步的深度神經網絡結構描述為:
第一組卷積:使用兩個連續的3*3*64的卷積對輸入圖像做卷積處理,提取特征;然后進行第一次池化操作;
第二組卷積:對第一次池化后的特征映射圖進行兩個連續的3*3*128的卷積操作;然后進行第二次池化操作;
第三組卷積:對第二次池化后的特征映射圖進行兩個連續的3*3*256的卷積操作;然后進行第三次池化操作;
第四組卷積:對第三次池化后的特征映射圖進行兩個連續的3*3*512的卷積操作;然后進行第四次池化操作;
反卷積層:對第四次池化后的特征映射圖進行上采樣操作,使用三個3*3*512的卷積對特征映射圖進行卷積操作;
輸出為與輸入圖片長寬相同即600*800*1的trimap圖片。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于西安電子科技大學,未經西安電子科技大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910144508.1/1.html,轉載請聲明來源鉆瓜專利網。





