[發(fā)明專(zhuān)利]用于消除線(xiàn)的圖像處理裝置、圖像處理方法及存儲(chǔ)介質(zhì)在審
| 申請(qǐng)?zhí)枺?/td> | 202010224697.6 | 申請(qǐng)日: | 2020-03-26 |
| 公開(kāi)(公告)號(hào): | CN113449729A | 公開(kāi)(公告)日: | 2021-09-28 |
| 發(fā)明(設(shè)計(jì))人: | 汪留安;孫俊 | 申請(qǐng)(專(zhuān)利權(quán))人: | 富士通株式會(huì)社 |
| 主分類(lèi)號(hào): | G06K9/34 | 分類(lèi)號(hào): | G06K9/34;G06K9/32;G06T5/00;G06T7/90 |
| 代理公司: | 北京集佳知識(shí)產(chǎn)權(quán)代理有限公司 11227 | 代理人: | 杜誠(chéng);馬驍 |
| 地址: | 日本神*** | 國(guó)省代碼: | 暫無(wú)信息 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 用于 消除 圖像 處理 裝置 方法 存儲(chǔ) 介質(zhì) | ||
本公開(kāi)內(nèi)容涉及圖像處理裝置、圖像處理方法及存儲(chǔ)介質(zhì)。根據(jù)本公開(kāi)內(nèi)容的一個(gè)實(shí)施例,該圖像處理裝置,包括:二值化單元,用于將灰度文檔圖像二值化作為目標(biāo)圖像;劃分單元,用于通過(guò)劃分目標(biāo)圖像得到沿第一方向布置的多個(gè)條形區(qū)域;有向圖確定單元,用于基于多個(gè)條形區(qū)域的區(qū)域內(nèi)連通域確定針對(duì)整個(gè)目標(biāo)圖像的有向圖;目標(biāo)路徑確定單元,用于基于有向圖確定與有向圖的單源最短路徑有關(guān)的目標(biāo)路徑;以及線(xiàn)消除單元,用于消除灰度文檔圖像中的與目標(biāo)路徑對(duì)應(yīng)的線(xiàn)。本公開(kāi)內(nèi)容的方法、裝置和存儲(chǔ)介質(zhì)至少能有助于實(shí)現(xiàn)以下效果之一:消除文檔圖像中的噪聲線(xiàn),處理速度快、占用計(jì)算資源少,以及改善文字識(shí)別引擎的識(shí)別性能。
技術(shù)領(lǐng)域
本公開(kāi)內(nèi)容總體上涉及圖像處理,更具體的,涉及用于消除線(xiàn)的圖像處理裝置、圖像處理方法及存儲(chǔ)介質(zhì)。
背景技術(shù)
使用光學(xué)字符識(shí)別(OCR:Optical Character Recognition)技術(shù)能夠?qū)D像中的文字轉(zhuǎn)換成文本。在光學(xué)字符識(shí)別的應(yīng)用中,需要對(duì)輸入圖像進(jìn)行預(yù)處理,以便于提高OCR識(shí)別引擎的識(shí)別性能。一般來(lái)說(shuō),輸入圖像中的噪聲越多,識(shí)別引擎的識(shí)別性能越低。對(duì)輸入圖像的預(yù)處理包括消除噪聲。因此預(yù)處理能夠提升識(shí)別引擎的性能。
因此,存在許多用于去除圖像中的諸如椒鹽噪聲的傳統(tǒng)圖像處理方法。
發(fā)明內(nèi)容
在下文中將給出關(guān)于本公開(kāi)內(nèi)容的簡(jiǎn)要概述,以便提供關(guān)于本公開(kāi)內(nèi)容的某些方面的基本理解。應(yīng)當(dāng)理解,此概述并不是關(guān)于本公開(kāi)內(nèi)容的窮舉性概述。它并不是意圖確定本公開(kāi)內(nèi)容的關(guān)鍵或重要部分,也不是意圖限定本公開(kāi)內(nèi)容的范圍。其目的僅僅是以簡(jiǎn)化的形式給出某些概念,以此作為稍后論述的更詳細(xì)描述的前序。
發(fā)明人發(fā)現(xiàn),在OCR識(shí)別中,輸入的文檔圖像中的文字附近可能有標(biāo)識(shí)行和/或列的非文字的標(biāo)識(shí)線(xiàn)。例如,來(lái)自于銀行表單、保險(xiǎn)、快遞的文本行圖像,其中有很多的上劃線(xiàn)和下劃線(xiàn)。通常這些線(xiàn)將會(huì)降低識(shí)別引擎的性能。這些線(xiàn)對(duì)識(shí)別引擎而言可以被認(rèn)為是噪聲,需要對(duì)其進(jìn)行預(yù)處理。在有些情況下,某些識(shí)別引擎有可能誤判輸入圖像中的前景像素和背景像素,這將會(huì)降低識(shí)別引擎的字符識(shí)別性能。例如,當(dāng)識(shí)別引擎將上述標(biāo)識(shí)線(xiàn)識(shí)別為前景像素,并試圖進(jìn)行文字識(shí)別時(shí),識(shí)別引擎的字符識(shí)別性能就會(huì)被劣化。鑒于此,發(fā)明人在本公開(kāi)內(nèi)容中提出一種基于有向圖的用于消除文檔圖像中的線(xiàn)的技術(shù)。
根據(jù)本公開(kāi)內(nèi)容的一個(gè)方面,提供了一種圖像處理方法,包括:將灰度文檔圖像二值化作為目標(biāo)圖像;通過(guò)劃分目標(biāo)圖像得到沿第一方向布置的多個(gè)條形區(qū)域;基于多個(gè)條形區(qū)域的區(qū)域內(nèi)連通域確定針對(duì)整個(gè)目標(biāo)圖像的有向圖;基于有向圖確定與有向圖的單源最短路徑有關(guān)的目標(biāo)路徑;以及消除灰度文檔圖像中的與目標(biāo)路徑對(duì)應(yīng)的線(xiàn)。
根據(jù)本公開(kāi)內(nèi)容的一個(gè)方面,提供了一種圖像處理裝置,包括:二值化單元,用于將灰度文檔圖像二值化作為目標(biāo)圖像;劃分單元,用于通過(guò)劃分目標(biāo)圖像得到沿第一方向布置的多個(gè)條形區(qū)域;有向圖確定單元,用于基于多個(gè)條形區(qū)域的區(qū)域內(nèi)連通域確定針對(duì)整個(gè)目標(biāo)圖像的有向圖;目標(biāo)路徑確定單元,用于基于有向圖確定與有向圖的單源最短路徑有關(guān)的目標(biāo)路徑;以及線(xiàn)消除單元,用于消除灰度文檔圖像中的與目標(biāo)路徑對(duì)應(yīng)的線(xiàn)。
根據(jù)本公開(kāi)內(nèi)容的另一方面,提供了一種其上存儲(chǔ)有程序的計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),其特征在于,程序使得在程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)圖像處理方法,圖像處理方法包括:將灰度文檔圖像二值化作為目標(biāo)圖像;通過(guò)劃分目標(biāo)圖像得到沿第一方向布置的多個(gè)條形區(qū)域;基于多個(gè)條形區(qū)域的區(qū)域內(nèi)連通域確定針對(duì)整個(gè)目標(biāo)圖像的有向圖;基于有向圖確定與有向圖的單源最短路徑有關(guān)的目標(biāo)路徑;以及消除灰度文檔圖像中的與目標(biāo)路徑對(duì)應(yīng)的線(xiàn)。
本公開(kāi)內(nèi)容的方法、裝置和存儲(chǔ)介質(zhì)至少能有助于實(shí)現(xiàn)如下效果之一:消除文檔圖像中的行線(xiàn),消除文檔圖像中的列線(xiàn),消除文檔圖像中的噪聲線(xiàn),處理速度快、占用計(jì)算資源少,以及改善文字識(shí)別引擎的識(shí)別性能。
附圖說(shuō)明
該專(zhuān)利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專(zhuān)利權(quán)人授權(quán)。該專(zhuān)利全部權(quán)利屬于富士通株式會(huì)社,未經(jīng)富士通株式會(huì)社許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買(mǎi)此專(zhuān)利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010224697.6/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專(zhuān)利網(wǎng)。
- 同類(lèi)專(zhuān)利
- 專(zhuān)利分類(lèi)
G06K 數(shù)據(jù)識(shí)別;數(shù)據(jù)表示;記錄載體;記錄載體的處理
G06K9-00 用于閱讀或識(shí)別印刷或書(shū)寫(xiě)字符或者用于識(shí)別圖形,例如,指紋的方法或裝置
G06K9-03 .錯(cuò)誤的檢測(cè)或校正,例如,用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標(biāo)記或含有代碼標(biāo)記的打印字符的,例如,由不同形狀的各個(gè)筆畫(huà)組成的,而且每個(gè)筆畫(huà)表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理,即無(wú)須判定關(guān)于圖像的同一性而進(jìn)行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合
- 彩色圖像和單色圖像的圖像處理
- 圖像編碼/圖像解碼方法以及圖像編碼/圖像解碼裝置
- 圖像處理裝置、圖像形成裝置、圖像讀取裝置、圖像處理方法
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序以及圖像解碼程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序、以及圖像解碼程序
- 圖像形成設(shè)備、圖像形成系統(tǒng)和圖像形成方法
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序





