[發明專利]一種基于深度學習的圖像目標摳取方法有效
| 申請號: | 201810649490.6 | 申請日: | 2018-06-22 |
| 公開(公告)號: | CN109035267B | 公開(公告)日: | 2021-07-27 |
| 發明(設計)人: | 全紅艷;沈卓薈 | 申請(專利權)人: | 華東師范大學 |
| 主分類號: | G06T7/12 | 分類號: | G06T7/12;G06N3/04;G06N3/08 |
| 代理公司: | 上海藍迪專利商標事務所(普通合伙) 31215 | 代理人: | 徐筱梅;張翔 |
| 地址: | 200241 *** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 深度 學習 圖像 目標 方法 | ||
本發明公開了一種基于深度學習的圖像目標摳取方法,在前景摳取策略中,建立了低分辨率與高分辨率結合的深度學習架構,解決了數據集質量不均的問題,并定義了合理的網絡結構與損失函數,以確保深度學習模型的質量和性能。通過自然圖像與合成圖像混合數據集的建立,解決了圖像目標摳取中數據集匱乏的問題。本發明避免了傳統的三分圖輸入的條件限制,實現了對前景目標的自動摳取,能夠獲得較為精細的圖像摳取結果。
技術領域
本發明涉及圖像合成技術領域,具體涉及一種基于深度學習的圖像目標摳取方法,采用自然圖像與合成圖像混合數據集的建立,解決了數據集匱乏的問題。進一步將低分辨率學習得到的特征應用于高分辨率圖像前景目標的學習過程中,構建低分辨率及高分辨率結合的學習機制,可以實現圖像前景目標的摳取。
背景技術
近年來,隨著計算機技術的不斷發展,在電子商務、醫學、娛樂等領域的實際應用中,越來越多地需要通過采集的數字圖像及視頻對現實世界進行理解。傳統的基于顏色采樣的圖像摳取方法對于待求解的未知區域的像素,在給定的前景區域及背景區域中進行采樣,得到與之顏色相近的樣本,進而通過樣本估計該像素的前景與背景成分經典的基于顏色采樣的方法僅在未知區域像素的局部窗口中進行采樣,具有一定的局限性。并且傳統的圖像摳取技術需要圖像遵循局部平滑性等先驗條件,同時還依賴于三分圖先驗信息。近年來,一些基于深度學習的圖像摳取方法進一步發展,如何建立有效的深度學習的網絡模型,有效解決自然圖像的摳圖問題,這都是亟待解決的實際問題。
發明內容
本發明的目的是針對現有技術的不足,并針對圖像摳圖中缺少細節的實際問題,提出一種基于深度學習的圖像目標摳取方法,該方法能夠獲得較為精細的圖像摳取結果,具有更高的實用價值。
實現本發明目的的具體技術方案是:
一種基于深度學習的圖像目標摳取方法,特點是通過自然圖像與合成圖像混合數據集的建立,解決了圖像目標摳取問題中的數據集匱乏問題。進一步通過構建低分辨率及高分辨率結合的卷積神經網絡學習策略,實現圖像前景目標的摳取。
具體包括以下步驟:
步驟1:構建合成圖像集SC
(a)前景圖像數據集的構建
從pngimg.com網站收集N張png格式的前景圖像,其中20000≤N≤30000,要包含人物、動物、前景物體各種類別;從其中篩選前景圖像Nc張,3810≤Nc≤N,要求所述篩選前景圖像必須是拍攝得到的自然圖像,并保持類別數種;
利用選出的Nc張圖像構建前景圖像數據集SF:其中是其中的第k+1張圖像;
(b)背景圖像數據集構建
從SUN2012數據集篩選NB張背景圖像,2182≤NB≤5000,構建背景圖像集合是其中的背景圖像,要求其不包含前景物體,并且要確保選取的背景圖像類別要涵蓋SUN2012的各個種類;
(c)合成圖像:在[0,NB-1]之間生成隨機的背景圖像序號RB,從背景圖像集合SB中按照RB取出隨機的背景圖像再在[0,Nc-1]之間生成1個隨機的前景圖像序號RF,從前景圖像集合SF中按照RF取出隨機前景圖像(2)疊加圖像,對于的裁剪或縮放處理:如果的水平或垂直尺度小于Nt,通過圖像縮放功能將圖像在該維度分辨率放大到Nt;否則,如果水平或垂直尺度大于Nt,那么在空域范圍內,隨機裁剪出分辨率為Nt×Nt的背景塊,記為
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于華東師范大學,未經華東師范大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810649490.6/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種利用普通攝像完成身份證便攜掃描的方法
- 下一篇:一種自適應圖像分割方法
- 彩色圖像和單色圖像的圖像處理
- 圖像編碼/圖像解碼方法以及圖像編碼/圖像解碼裝置
- 圖像處理裝置、圖像形成裝置、圖像讀取裝置、圖像處理方法
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序以及圖像解碼程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序、以及圖像解碼程序
- 圖像形成設備、圖像形成系統和圖像形成方法
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序





