[發(fā)明專利]文本圖像處理方法、裝置、電子設(shè)備及計(jì)算機(jī)可讀介質(zhì)在審
| 申請(qǐng)?zhí)枺?/td> | 201811486458.7 | 申請(qǐng)日: | 2018-12-06 |
| 公開(公告)號(hào): | CN109685052A | 公開(公告)日: | 2019-04-26 |
| 發(fā)明(設(shè)計(jì))人: | 丁笑天;劉巖 | 申請(qǐng)(專利權(quán))人: | 泰康保險(xiǎn)集團(tuán)股份有限公司 |
| 主分類號(hào): | G06K9/20 | 分類號(hào): | G06K9/20;G06K9/34;G06K9/62 |
| 代理公司: | 隆天知識(shí)產(chǎn)權(quán)代理有限公司 72003 | 代理人: | 章侃銥;鄭特強(qiáng) |
| 地址: | 100031 北*** | 國(guó)省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 計(jì)算機(jī)可讀介質(zhì) 電子設(shè)備 文本區(qū)域 文本圖像 表格線 原始文本圖像 目標(biāo)文本 光學(xué)字符識(shí)別 圖像 光學(xué)字符 合并處理 同一單元 整體輸出 正確率 檢測(cè) 算法 文本 中文 | ||
本公開涉及一種文本圖像處理方法、裝置、電子設(shè)備及計(jì)算機(jī)可讀介質(zhì)。該方法包括:對(duì)原始文本圖像進(jìn)行文本區(qū)域檢測(cè),生成多個(gè)文本區(qū)域塊;對(duì)所述原始文本圖像進(jìn)行表格線檢測(cè),生成表格線;基于所述表格線將所述多個(gè)文本區(qū)域塊進(jìn)行合并處理,生成目標(biāo)文本圖像;以及通過所述目標(biāo)文本圖像進(jìn)行光學(xué)字符識(shí)別。本公開涉及的文本圖像處理方法、裝置、電子設(shè)備及計(jì)算機(jī)可讀介質(zhì),能夠?qū)儆谕恍小⑼粏卧竦奈谋咀鳛檎w輸出,從而能夠提升光學(xué)字符算法中文本識(shí)別的正確率。
技術(shù)領(lǐng)域
本公開涉及計(jì)算機(jī)信息處理領(lǐng)域,具體而言,涉及一種文本圖像處理方法、裝置、電子設(shè)備及計(jì)算機(jī)可讀介質(zhì)。
背景技術(shù)
在公司辦公流程中,掃描文檔應(yīng)用十分頻繁,例如簽發(fā)公文、發(fā)票信息、歸檔電子檔案等;很多情況下人們需要從掃描文檔中(即掃描儀輸出的圖片)提取出文字信息,從而便于修改、存儲(chǔ)、檢索、利用及傳輸。因此如何高效地獲取掃描文檔的文字信息,具有重要的意義。
光學(xué)字符識(shí)別(Optical Character Recognition,OCR)技術(shù),是通過對(duì)圖片中的文字進(jìn)行提取識(shí)別,轉(zhuǎn)換成可檢索的數(shù)據(jù)的過程。當(dāng)前 OCR技術(shù)已經(jīng)成為掃描文檔識(shí)別最重要的手段之一。然而,現(xiàn)今的OCR 技術(shù)并未發(fā)展完善,其識(shí)別正確率受諸多因素影響。其中,OCR技術(shù)中的文本檢測(cè)分割包括字符區(qū)域檢測(cè)和字符切分。不同文檔的字符區(qū)域位置、字體、字號(hào)、語(yǔ)言(中文、英文、其他語(yǔ)言等)都不盡相同;并且不同文檔本身的背景也很大可能不同。文本識(shí)別分類器的性能,會(huì)依賴于快速準(zhǔn)確的文本(及文本行)處理和定位算法。文本(及文本行)處理和定位的精度,往往能決定整個(gè)OCR識(shí)別過程的正確率。
而且,銀行、保險(xiǎn)行業(yè)中涉及的很多掃描文件都是表格形式的文本,例如體檢表格、各種票據(jù)等。在文本行處理和分割過程中,需要根據(jù)文件中的表格關(guān)系,組織文本的輸出,以形成結(jié)構(gòu)化文字輸出。由于帶有表格的文本圖像比普通文本更加復(fù)雜,現(xiàn)有技術(shù)中的對(duì)帶有表格的文本圖像的文本行處理和定位具有很大的缺陷。
因此,需要一種新的文本圖像處理方法、裝置、電子設(shè)備及計(jì)算機(jī)可讀介質(zhì)。
在所述背景技術(shù)部分公開的上述信息僅用于加強(qiáng)對(duì)本公開的背景的理解,因此它可以包括不構(gòu)成對(duì)本領(lǐng)域普通技術(shù)人員已知的現(xiàn)有技術(shù)的信息。
發(fā)明內(nèi)容
有鑒于此,本公開提供一種文本圖像處理方法、裝置、電子設(shè)備及計(jì)算機(jī)可讀介質(zhì),能夠?qū)儆谕恍小⑼粏卧竦奈谋咀鳛檎w輸出,從而能夠提升光學(xué)字符算法中的文本識(shí)別的正確率。
本公開的其他特性和優(yōu)點(diǎn)將通過下面的詳細(xì)描述變得顯然,或部分地通過本公開的實(shí)踐而習(xí)得。
根據(jù)本公開的一方面,提出一種文本圖像處理方法,該方法包括:對(duì)原始文本圖像進(jìn)行文本區(qū)域檢測(cè),生成多個(gè)文本區(qū)域塊;對(duì)所述原始文本圖像進(jìn)行表格線檢測(cè),生成表格線;基于所述表格線將所述多個(gè)文本區(qū)域塊進(jìn)行合并處理,生成目標(biāo)文本圖像;以及通過光學(xué)字符識(shí)別方法對(duì)所述目標(biāo)文本圖像進(jìn)行文字識(shí)別。
在本公開的一種示例性實(shí)施例中,對(duì)原始文本圖像進(jìn)行文本區(qū)域檢測(cè),生成多個(gè)文本區(qū)域塊包括:通過區(qū)域特征提取算法確定所述原始文本圖像中的目標(biāo)區(qū)域;以及提取帶有文本的目標(biāo)區(qū)域以生成所述多個(gè)文本區(qū)域塊。
在本公開的一種示例性實(shí)施例中,提取帶有文本的目標(biāo)區(qū)域以生成所述多個(gè)文本區(qū)域塊包括:獲取目標(biāo)區(qū)域;通過像素投影方法獲取所述目標(biāo)區(qū)域在預(yù)定方向上的投影數(shù)據(jù);通過滑動(dòng)窗口檢測(cè)法與投影數(shù)據(jù)提取確定所述目標(biāo)區(qū)域中帶有文本的部分目標(biāo)區(qū)域;以及通過帶有文本的部分目標(biāo)區(qū)域生成所述多個(gè)文本區(qū)域塊。
在本公開的一種示例性實(shí)施例中,通過滑動(dòng)窗口檢測(cè)法與投影數(shù)據(jù)提取確定所述目標(biāo)區(qū)域中帶有文本的部分目標(biāo)區(qū)域包括:通過滑動(dòng)窗口檢測(cè)法與投影數(shù)據(jù)提取獲取帶有文本的目標(biāo)區(qū)域;以及通過文本特征方法由提取帶有文本的部分目標(biāo)區(qū)域。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于泰康保險(xiǎn)集團(tuán)股份有限公司,未經(jīng)泰康保險(xiǎn)集團(tuán)股份有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811486458.7/2.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 上一篇:一種基于電網(wǎng)系統(tǒng)的紅外圖像故障診斷系統(tǒng)
- 下一篇:訓(xùn)練文字識(shí)別系統(tǒng)的方法、裝置、存儲(chǔ)介質(zhì)及電子設(shè)備
- 同類專利
- 專利分類
G06K 數(shù)據(jù)識(shí)別;數(shù)據(jù)表示;記錄載體;記錄載體的處理
G06K9-00 用于閱讀或識(shí)別印刷或書寫字符或者用于識(shí)別圖形,例如,指紋的方法或裝置
G06K9-03 .錯(cuò)誤的檢測(cè)或校正,例如,用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標(biāo)記或含有代碼標(biāo)記的打印字符的,例如,由不同形狀的各個(gè)筆畫組成的,而且每個(gè)筆畫表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理,即無須判定關(guān)于圖像的同一性而進(jìn)行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合
- 通過下載證書來控制對(duì)計(jì)算機(jī)可讀內(nèi)容的訪問的系統(tǒng)及方法
- 用于生產(chǎn)組合物的監(jiān)測(cè)設(shè)備
- 計(jì)算機(jī)可讀的掩模收縮控制處理器
- 用于動(dòng)態(tài)授權(quán)對(duì)被許可內(nèi)容的訪問的方法、系統(tǒng)和產(chǎn)品
- 監(jiān)視和控制計(jì)算機(jī)可讀介質(zhì)上的數(shù)據(jù)的訪問的裝置和方法
- 光電子模塊和用于操作所述光電子模塊的方法
- 用于將操作系統(tǒng)存儲(chǔ)在計(jì)算機(jī)可讀介質(zhì)上的BIOS代碼
- 相機(jī)組同步曝光控制方法及系統(tǒng)、計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)、相機(jī)組控制系統(tǒng)
- 炒鍋翻炒方法、計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)及智能炒菜機(jī)
- 用于計(jì)算機(jī)系統(tǒng)啟動(dòng)操作的系統(tǒng)及方法
- 經(jīng)歷光學(xué)字符識(shí)別的圖像的頁(yè)面布局確定
- 一種基于塊投影的藏文歷史文獻(xiàn)文本區(qū)域提取方法
- 文本區(qū)域檢測(cè)方法及裝置、文本檢測(cè)方法、計(jì)算機(jī)可讀介質(zhì)
- 一種文本區(qū)域劃分方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 圖像中文本區(qū)域的位置確定方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 圖像中文本區(qū)域的檢測(cè)方法、裝置、計(jì)算機(jī)設(shè)備及計(jì)算機(jī)存儲(chǔ)介質(zhì)
- 一種文本檢測(cè)方法、文本檢測(cè)裝置、電子設(shè)備及存儲(chǔ)介質(zhì)
- 文本布局方法、裝置、存儲(chǔ)介質(zhì)及終端
- 圖像識(shí)別方法、裝置、終端和存儲(chǔ)介質(zhì)
- 文本檢測(cè)方法、裝置、電子設(shè)備及計(jì)算機(jī)存儲(chǔ)介質(zhì)
- 文本圖像的處理方法、裝置、存儲(chǔ)介質(zhì)及終端
- 一種文本圖像的傾斜校正方法、裝置以及圖像處理設(shè)備
- 文本圖像的處理方法及裝置
- 文本圖像處理方法、文本及卡證圖像質(zhì)量評(píng)價(jià)方法和裝置
- 圖像中的文本切割方法、裝置、設(shè)備及可讀存儲(chǔ)介質(zhì)
- 一種文本圖像質(zhì)量評(píng)估方法、裝置、設(shè)備及介質(zhì)
- 簡(jiǎn)化圖像獲取模型訓(xùn)練、圖像文本識(shí)別方法及相關(guān)裝置
- 一種文本識(shí)別模型的生成方法以及裝置
- 一種文本圖像配準(zhǔn)方法、電子設(shè)備及其存儲(chǔ)介質(zhì)
- 文本圖像相似度評(píng)估方法、裝置、電子設(shè)備及存儲(chǔ)介質(zhì)





