[發明專利]一種自動人像分割方法在審
| 申請號: | 201710481570.0 | 申請日: | 2017-06-22 |
| 公開(公告)號: | CN107330900A | 公開(公告)日: | 2017-11-07 |
| 發明(設計)人: | 陳丹 | 申請(專利權)人: | 成都品果科技有限公司 |
| 主分類號: | G06T7/11 | 分類號: | G06T7/11;G06T7/13;G06T7/187;G06N3/04 |
| 代理公司: | 成都玖和知識產權代理事務所(普通合伙)51238 | 代理人: | 黎祖琴 |
| 地址: | 610000 四川*** | 國省代碼: | 四川;51 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 自動 人像 分割 方法 | ||
技術領域
本發明屬于圖像處理技術領域,特別是涉及一種自動人像分割方法。
背景技術
近年來,隨著科技的發展,每天都有大量的數字圖片產生,而各種圖像處理技術也是層出不窮。其中,對人像的個性化處理更是一個極富活力的研究領域。從美膚、五官美化、背景替換,每一步都為人像美化提供了助力。而快速準確的人像分割正是前述背景替換模塊的關鍵步驟。分割的準確性直接影響了背景替換的質量與多樣性,同時,也影響了美膚的一致性。
目前,存在很多人像分割算法,比如早期的交互式分割Graphcut等,基于crf的分割,近期等基于深度學習的fcn等。交互式方法,往往需要用戶對圖像分割有一定的了解,可以畫出比較好的分割線,用戶體驗稍差,且分割速度較慢,通常需要幾十秒的時間;基于crf的分割同樣是速度較慢;而fcn方法存在的問題主要有三點,一是模型尺寸較大,通常有幾百兆,不利于用于移動端,二是計算量較大,速度非常慢,通常需要幾秒到幾十秒;三是計算過程中涉及到pooling層計算,影響了分割的精度。
發明內容
為了解決上述問題,本發明提出了一種自動人像分割方法,能夠自動且準確的進行人像分割,耗時短且占用空間小,適用于移動客戶端。
為達到上述目的,本發明采用的技術方案是:
一種自動人像分割方法,包括步驟模型訓練、人像初步分割和人像精確分割;
所述模型訓練包括步驟:獲取訓練數據;將訓練數據輸入神經網絡,學習得到網絡參數模型;當神經網絡收斂后,存儲所述網絡參數模型,完成模型訓練;
所述人像初步分割包括步驟:載入所述網絡參數模型到移動客戶端;利用移動客戶端獲取輸入圖像;將所述輸入圖像輸入網絡參數模型,得到人像分割初步圖像;
所述人像精確分割包括步驟:對人像分割初步圖像,去除錯分的孤立區,保留連通區域;利用摳像算法對連通區域分割細節,突出邊緣,得到人像分割最終圖像。
進一步的是,所述獲取訓練數據過程包括步驟:搜集人像圖片;人工標注人像區域,形成與人像圖片對應的掩碼圖;將掩碼圖進行縮放至預定尺寸后構成訓練數據。
進一步的是,所述神經網絡包含卷積模塊、上采樣層和softmax層;每個所述卷積模塊包括卷積層、relu層和pooling層。
進一步的是,所述神經網絡包含5個卷積模塊、2個上采樣層和1個softmax層。
進一步的是,將訓練數據輸入神經網絡后,初始化神經網絡;用自適應估計矩陣算法更新神經網絡權值;訓練過程中,動態調節學習率;經過學習得到網絡參數模型。
進一步的是,獲取輸入圖像后,將輸入圖像進行尺寸縮放到預定尺寸;再將縮放后的圖像輸入網絡參數模型,得到人像分割掩碼圖,人像分割掩碼圖作為人像分割初步圖像。
進一步的是,將所述人像分割掩碼圖進行形態學運算,去除錯分的孤立區,獲得多個連通區域;計算各連通區域的面積并排序,去除不在預設區域內的連通區域,保留剩余的連通區域。
進一步的是,對所述保留的連通區域的外邊緣處根據預定像素建立擴展區域,通過摳像算法對擴展區域進行分割細節和突出邊緣,得到人像分割最終圖像。
采用本技術方案的有益效果:
本發明提出一個瘦長型的深度神經網絡結構,極大地縮減了計算量和模型尺寸,從而實現移動端快速人像分割;
本發明提出一個高效的分割算法,提高分割精度,在我們的標注數據集上IOU為94.16%;標注大量的訓練數據,極大地提高了訓練模型的性能。
附圖說明
圖1為本發明的一種自動人像分割方法流程示意圖;
圖2為本發明中模型訓練的流程示意圖;
圖3為本發明中人像初步分割的流程示意圖;
圖4為本發明中人像精確分割的流程示意圖;
圖5為本發明中神經網絡的結構示意圖;
圖6為本發明中卷積模塊的結構示意圖。
具體實施方式
為了使本發明的目的、技術方案和優點更加清楚,下面結合附圖對本發明作進一步闡述。
在本實施例中,參見圖1-圖4所示,本發明提出了一種自動人像分割方法,包括步驟模型訓練、人像初步分割和人像精確分割。
1.所述模型訓練包括步驟:獲取訓練數據;將訓練數據輸入神經網絡,學習得到網絡參數模型;當神經網絡收斂后,存儲所述網絡參數模型,完成模型訓練。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于成都品果科技有限公司,未經成都品果科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710481570.0/2.html,轉載請聲明來源鉆瓜專利網。





