[發明專利]一種基于迭代分割的圖像語義分割方法有效
| 申請號: | 202010546056.2 | 申請日: | 2020-06-16 |
| 公開(公告)號: | CN111666949B | 公開(公告)日: | 2023-06-20 |
| 發明(設計)人: | 俞揚;詹德川;周志華;陳駿 | 申請(專利權)人: | 南京大學 |
| 主分類號: | G06V10/26 | 分類號: | G06V10/26;G06N3/0464;G06V10/774;G06V20/70;G06V10/82;G06V10/764 |
| 代理公司: | 南京樂羽知行專利代理事務所(普通合伙) 32326 | 代理人: | 李玉平 |
| 地址: | 210023 江蘇*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 分割 圖像 語義 方法 | ||
本發明公開一種基于迭代分割的圖像語義分割方法,包括:圖像預處理,通過圖像增強模型對輸入的樣本圖像進行增強,得到增強樣本圖像,然后對所述增強樣本圖像進行若干次分割,如此反復得到最終的卷積神經網絡,根據最終的卷積神經網絡對圖像進行語義分割,輸出語義分割結果;本發明后續的樣本圖像是由最初的增強樣本圖像分割而成的,由于其經過多次分割,數量會逐漸龐大,并且先訓練后驗證,再訓練再驗證,如此反復得到最終的卷積神經網絡,訓練數據和驗證數據之間相當于存在母體和子體關系,既不會產生因訓練數據差異較大導致的精度降低問題,而且還由于訓練數據之間的漂移較小,有助于提升精度。
技術領域
本發明涉及一種基于迭代分割的圖像語義分割方法,應用于靜態2D圖像、視頻甚至3D數據、體數據的圖像語義分割,屬于圖像處理技術領域。
背景技術
圖像語義分割是從像素水平上,理解、識別圖片的內容,其目的是建立每個像素和語義類別之間的一一映射關系,根據語義信息進行分割,其被廣泛應用于場景理解、自動駕駛、醫學影像分析、機器人視覺等領域。圖像語義分割是圖像理解的基石,其分割結果的好壞將直接影響對后續圖像內容的處理,因此,對圖像語義分割技術的研究具有非常重要的現實意義。
現有技術中,利用卷積神經網絡進行語義分割是常用的技術手段,而卷積神經網絡的建立在整個過程中非常重要。語義分割(應用于靜態2D圖像、視頻甚至3D數據、體數據)是計算機視覺的關鍵問題之一。在宏觀意義上來說,語義分割是為場景理解鋪平了道路的一種高層任務。作為計算機視覺的核心問題,場景理解的重要性越來越突出,因為現實中越來越多的應用場景需要從影像中推理出相關的知識或語義(即由具體到抽象的過程)。這些應用包括自動駕駛,人機交互,計算攝影學,圖像搜索引擎,增強現實等。應用各種傳統的計算機視覺和機器學習技術,這些問題已經得到了解決。雖然這些方法很流行,但深度學習革命讓相關領域發生了翻天覆地的變化,因此,包括語義分割在內的許多計算機視覺問題都開始使用深度架構來解決,通常是卷積神經網絡CNN,而CNN在準確率甚至效率上都遠遠超過了傳統方法。
但是現有技術訓練卷積神經網絡的進行圖像語義分割的手段較為單一,由于圖像樣本數據之間關聯性不強,漂移量大,導致最終的卷積神經網絡進行圖像語義分割的精度不高,誤差較大。
發明內容
發明目的:針對現有技術中存在的問題與不足,本發明提供一種基于迭代分割的圖像語義分割方法。
技術方案:一種基于迭代分割的圖像語義分割方法,包括如下內容:
圖像預處理,通過圖像增強模型對輸入的樣本圖像進行增強,得到增強樣本圖像,然后對所述增強樣本圖像進行若干次分割,每次分割后的數量均為前一次分割的倍數,以N1、N2,…,Ni表示,其中,Ni代表經過第i-1次分割后的增強樣本圖像數量;
卷積神經網絡的訓練,以分割后數量為N1的增強樣本圖像作為初始訓練樣本訓練卷積神經網絡,以N2為初始驗證樣本對卷積神經網絡進行驗證,對卷積神經網絡的參數進行更新,再以N3對卷積神經網絡進行再次訓練,以N4對卷積神經網絡進行驗證,對卷積神經網絡的參數進行更新,如此反復得到最終的卷積神經網絡;
根據最終的卷積神經網絡對圖像進行語義分割,輸出語義分割結果。
對樣本圖像的圖像預處理包括圖像尺寸變換、圖像質量檢測和圖像顏色校正,其中,所述圖像尺寸變換用于改變圖像尺寸,將樣本圖像修改成設定尺寸;所述圖像質量檢測用于判定圖像質量是否滿足訓練需求,且在圖像質量不滿足訓練需求時重新更換樣本圖像;所述圖像顏色校正用于還原樣本圖像在標準光源下的真實色彩。
圖像質量是否滿足訓練需求,指的是圖像的像素、邊緣輪廓模糊等是否滿足訓練需求。例如在圖像的像素較低時,需要重新更換樣本圖像。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于南京大學,未經南京大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010546056.2/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種市政廢水的處理方法及系統
- 下一篇:一種植物油生產用烘干裝置
- 彩色圖像和單色圖像的圖像處理
- 圖像編碼/圖像解碼方法以及圖像編碼/圖像解碼裝置
- 圖像處理裝置、圖像形成裝置、圖像讀取裝置、圖像處理方法
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序以及圖像解碼程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序、以及圖像解碼程序
- 圖像形成設備、圖像形成系統和圖像形成方法
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序





