[發明專利]一種表面壓印字符圖像的無監督分割方法在審
| 申請號: | 202110902063.6 | 申請日: | 2021-08-06 |
| 公開(公告)號: | CN113627436A | 公開(公告)日: | 2021-11-09 |
| 發明(設計)人: | 韓宗桓;劉名果;陳立家;田敏;蘭天翔;梁倩;代震;王贊 | 申請(專利權)人: | 河南大學 |
| 主分類號: | G06K9/34 | 分類號: | G06K9/34;G06K9/62;G06N3/04;G06N3/08 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 475001 河南*** | 國省代碼: | 河南;41 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 表面 壓印 字符 圖像 監督 分割 方法 | ||
本發明公開了一種表面壓印字符圖像的無監督分割方法。為解決全監督語義分割網絡需要大量手工標定的標簽作為訓練樣本的問題,本發明以改進型循環式生成對抗網絡為基礎框架,利用其無監督訓練的特性,再結合傳統圖像分割算法,實現了表面壓印字符圖像無監督分割。CycleGAN廣泛應用于圖像風格遷移等領域。本發明針對CycleGAN難以對兩域間特征差異過大的圖像進行風格遷移進而實現語義分割的問題,通過對CycleGAN的生成器和判別器進行改進,使之適應語義分割任務實際需要,實現了表面壓印字符圖像無監督分割。改進型循環式生成對抗網絡的生成器中設計了多尺度特征融合模塊,并引入了注意力機制提升網絡性能。同時,本發明提出一種U型判別器,可為生成器提供更加精確的反饋,實現了高精度的表面壓印字符圖像無監督語義分割。
技術領域
本發明涉及圖像語義分割技術領域,尤其涉及一種表面壓印字符圖像的無監督分割方法。
背景技術
當今,圖像語義分割在工業、農業、醫療以及服務業等領域都有廣泛的應用。在工業方面,圖像語義分割可以幫助工業機器人進行目標定位。在農業方面,圖像語義分割可以進行農作物種類識別。在醫療方面,圖像語義分割可以幫助醫生確定病變種類及區域,精確識別病變邊界。在服務業,圖像語義分割已廣泛應用于人像摳圖、字符識別和自動駕駛等領域。圖像語義分割的應用已經涵蓋了各個領域。二分類語義分割的目的在于根據圖像語義信息將圖像內容區分為前景和背景。表面壓印字符圖像分割既是二分類語義分割的一個現實應用場景,也是字符識別最重要的步驟。基于深度學習的圖像分割算法可以解決復雜光線條件下表面壓印字符圖像難以進行固定閾值分割的問題,具有傳統算法無可比擬的優點。盡管基于深度學習的語義分割方法已經在各個領域取得了較為良好的效果,然而絕大部分圖像分割算法均采用全監督的方式進行訓練,需要大量手工標記的標簽作為訓練樣本。消耗了大量的人力物力資源,部分大型數據集的構建甚至需要數月之久。因此,無監督語義分割具有廣闊的應用前景和重要的現實意義。圖像語義分割任務常用的評價指標有像素精度、平均像素精度、平均交并比、頻率權重交并比等。
近年來,眾多研究者提出了一系列全監督語義分割算法。2014 年提出的FCN首次將神經網絡的最后一層全連接層替換為卷積層,設計了一個全卷積網絡,可以接受任意尺寸的輸入。2015年提出的U-Net設計了一個編碼與解碼部分相互對稱的U型網絡,在醫學影像分割領域取得了巨大成功。生成對抗網絡GAN(Generative Adversarial Networks,GAN)和循環式生成對抗網絡(Cycle-Consistent Generative Adversarial Networks,CycleGAN)的提出使得無監督語義分割成為了可能。但CycleGAN主要應用于風格遷移領域,不適用于語義分割任務。本發明針對CycleGAN結構進行了改進,使其滿足語義分割任務需要,實現了表面壓印字符圖像無監督分割。
發明內容
針對現有基于深度學習的絕大部分表面壓印字符圖像分割算法需要大量手工標記的標簽作為訓練數據的問題,本發明提出一種表面壓印字符圖像的無監督分割方法,利用循環式生成對抗網絡無監督訓練的特性有效的解決了表面壓印字符圖像分割問題,節省了大量人工標注成本。
為了達到上述目的,本發明的技術方案如下:一種表面壓印字符圖像的無監督分割方法,其步驟如下:
步驟一:構造網絡訓練樣本與測試樣本;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于河南大學,未經河南大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110902063.6/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:半導體器件的制備方法及半導體器件
- 下一篇:一種快速識別石墨電極標簽的方法
- 彩色圖像和單色圖像的圖像處理
- 圖像編碼/圖像解碼方法以及圖像編碼/圖像解碼裝置
- 圖像處理裝置、圖像形成裝置、圖像讀取裝置、圖像處理方法
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序以及圖像解碼程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序、以及圖像解碼程序
- 圖像形成設備、圖像形成系統和圖像形成方法
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序





