[發(fā)明專利]基于OCR的財(cái)務(wù)報(bào)表信息檢測(cè)和識(shí)別方法在審
| 申請(qǐng)?zhí)枺?/td> | 202010898577.4 | 申請(qǐng)日: | 2020-08-31 |
| 公開(kāi)(公告)號(hào): | CN112016481A | 公開(kāi)(公告)日: | 2020-12-01 |
| 發(fā)明(設(shè)計(jì))人: | 李振;魯賓賓;劉挺;劉昊霖;翟昶;陳遠(yuǎn)琴;母丹;王子祎 | 申請(qǐng)(專利權(quán))人: | 民生科技有限責(zé)任公司 |
| 主分類號(hào): | G06K9/00 | 分類號(hào): | G06K9/00;G06K9/20;G06K9/34;G06K9/40 |
| 代理公司: | 北京金智普華知識(shí)產(chǎn)權(quán)代理有限公司 11401 | 代理人: | 巴曉艷 |
| 地址: | 101300 北*** | 國(guó)省代碼: | 北京;11 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 基于 ocr 財(cái)務(wù)報(bào)表 信息 檢測(cè) 識(shí)別 方法 | ||
本發(fā)明涉及財(cái)務(wù)數(shù)據(jù)分析技術(shù)領(lǐng)域,提供了一種基于OCR的財(cái)務(wù)報(bào)表信息檢測(cè)和識(shí)別方法,包括:對(duì)財(cái)務(wù)報(bào)表圖像進(jìn)行圖像預(yù)處理、財(cái)務(wù)報(bào)表非表格區(qū)域信息提取、財(cái)務(wù)報(bào)表表格區(qū)域信息提取、文本檢測(cè)、文本識(shí)別、格式化輸出、配平校驗(yàn)。本發(fā)明首先區(qū)分是正常的表格、三線表、無(wú)線表;針對(duì)不同制表方式,采用不同的區(qū)域定位方法快速完成財(cái)務(wù)要素定位;用文字檢測(cè)識(shí)別方法完成各要素的識(shí)別;針對(duì)數(shù)字混淆、小數(shù)點(diǎn)錯(cuò)漏問(wèn)題,根據(jù)會(huì)計(jì)準(zhǔn)則設(shè)置科目間配平規(guī)則,如OCR結(jié)果通過(guò)配平校驗(yàn),才認(rèn)為輸出了正確的識(shí)別結(jié)果;本發(fā)明能大幅提高財(cái)務(wù)報(bào)表處理效率,能確保財(cái)務(wù)報(bào)表表格區(qū)域提取的準(zhǔn)確性和通用性以及財(cái)務(wù)報(bào)表領(lǐng)域文本識(shí)別準(zhǔn)確性,具有推廣應(yīng)用價(jià)值。
技術(shù)領(lǐng)域
本發(fā)明涉及財(cái)務(wù)數(shù)據(jù)分析技術(shù)領(lǐng)域,特別涉及一種基于OCR的財(cái)務(wù)報(bào)表信息檢測(cè)和識(shí)別方法。
背景技術(shù)
銀行、稅務(wù)、審計(jì)等機(jī)構(gòu)存在大量基于財(cái)務(wù)報(bào)表的數(shù)據(jù)分析工作。按照財(cái)務(wù)報(bào)表種類的不同,每個(gè)財(cái)務(wù)報(bào)表至少有30-200個(gè)字段需要錄入。手工處理效率低、易出錯(cuò),與人工手工錄入相比,財(cái)報(bào)OCR技術(shù)可直接從財(cái)報(bào)影像中提取科目、金額等重要數(shù)據(jù),幫助銀行、稅務(wù)、審計(jì)等提高工作效率,構(gòu)建自動(dòng)化的信審系統(tǒng)。
OCR(Optical Character Recognition,光學(xué)字符識(shí)別)是指電子設(shè)備(例如掃描儀或數(shù)碼相機(jī))檢查紙上打印的字符,通過(guò)檢測(cè)暗、亮的模式確定其形狀,然后用字符識(shí)別方法將形狀翻譯成計(jì)算機(jī)文字的過(guò)程。OCR傳統(tǒng)上是指對(duì)輸入掃描的文檔圖形進(jìn)行分析和處理,檢測(cè)并識(shí)別出圖像中的文字信息,一般包含了文字檢測(cè)(Text Detection)和文字識(shí)別(Text Recognition)兩部分。
實(shí)際操作中,由于財(cái)務(wù)報(bào)表制表方式多樣以及OCR識(shí)別出現(xiàn)容易數(shù)字混淆、小數(shù)點(diǎn)錯(cuò)漏等問(wèn)題,市場(chǎng)上存在的財(cái)務(wù)報(bào)表OCR識(shí)別系統(tǒng)無(wú)法輸出精確度很高的識(shí)別結(jié)果。
發(fā)明內(nèi)容
本申請(qǐng)解決的技術(shù)問(wèn)題:
由于財(cái)務(wù)報(bào)表的格式多樣復(fù)雜,表格區(qū)域與非表格區(qū)域互相交疊,目前,仍沒(méi)有一種有效的方法將財(cái)務(wù)報(bào)表里的所有內(nèi)容進(jìn)行檢測(cè)識(shí)別并格式化輸出。
財(cái)務(wù)報(bào)表制表OCR識(shí)別出現(xiàn)容易數(shù)字混淆、小數(shù)點(diǎn)錯(cuò)漏等問(wèn)題,市場(chǎng)上存在的財(cái)務(wù)報(bào)表OCR識(shí)別系統(tǒng)無(wú)法輸出精確度很高的識(shí)別結(jié)果。
本申請(qǐng)的整體技術(shù)思路:
本發(fā)明通過(guò)分析財(cái)務(wù)報(bào)表的樣式特點(diǎn),提出了3種主流樣式的財(cái)務(wù)報(bào)表分析提取方法,將財(cái)務(wù)報(bào)表的表格和非表格信息分別進(jìn)行檢測(cè)和識(shí)別,最終將不同區(qū)域的內(nèi)容進(jìn)行格式化輸出。
針對(duì)制表多樣的問(wèn)題,首先通過(guò)判斷圖片上的最長(zhǎng)的橫線兩端是否與豎線有交點(diǎn),區(qū)分是正常的表格、三線表、無(wú)線表;針對(duì)不同的制表方式,采用不同的區(qū)域定位方法快速完成財(cái)務(wù)要素的定位;然后用文字檢測(cè)識(shí)別方法完成各要素的識(shí)別。
針對(duì)數(shù)字混淆、小數(shù)點(diǎn)錯(cuò)漏的問(wèn)題,根據(jù)會(huì)計(jì)準(zhǔn)則,設(shè)置科目間的配平規(guī)則,如OCR結(jié)果通過(guò)配平校驗(yàn),才認(rèn)為輸出了正確的識(shí)別結(jié)果;否則,會(huì)繼續(xù)進(jìn)行OCR識(shí)別,調(diào)整識(shí)別結(jié)果。
本發(fā)明采用如下技術(shù)方案:
一種基于OCR的財(cái)務(wù)報(bào)表信息檢測(cè)和識(shí)別方法,包括如下步驟:
S1、識(shí)別財(cái)務(wù)報(bào)表圖像的非表格區(qū)域,提取非表格區(qū)域信息;
S2、對(duì)財(cái)務(wù)報(bào)表圖像的表格區(qū)域進(jìn)行細(xì)分識(shí)別,得到所有的數(shù)據(jù)單元格,按照所述數(shù)據(jù)單元格進(jìn)行子圖切分;
S3、對(duì)步驟S2中切分出的子圖進(jìn)行文本檢測(cè),識(shí)別出子圖中的文本區(qū)域;
S4、對(duì)經(jīng)步驟S3文本識(shí)別后的文本區(qū)域進(jìn)行文本識(shí)別;
S5、將表格區(qū)域和非表格區(qū)域的文本識(shí)別內(nèi)容進(jìn)行排版整合,以結(jié)構(gòu)化的方式輸出財(cái)務(wù)報(bào)表信息。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于民生科技有限責(zé)任公司,未經(jīng)民生科技有限責(zé)任公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買(mǎi)此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010898577.4/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06K 數(shù)據(jù)識(shí)別;數(shù)據(jù)表示;記錄載體;記錄載體的處理
G06K9-00 用于閱讀或識(shí)別印刷或書(shū)寫(xiě)字符或者用于識(shí)別圖形,例如,指紋的方法或裝置
G06K9-03 .錯(cuò)誤的檢測(cè)或校正,例如,用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標(biāo)記或含有代碼標(biāo)記的打印字符的,例如,由不同形狀的各個(gè)筆畫(huà)組成的,而且每個(gè)筆畫(huà)表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理,即無(wú)須判定關(guān)于圖像的同一性而進(jìn)行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合
- OCR文檔識(shí)別方法及其裝置
- 智能調(diào)度多OCR識(shí)別引擎的方法及設(shè)備
- OCR掛接方法、裝置與設(shè)備
- 一種用于教學(xué)系統(tǒng)的OCR識(shí)別方法、裝置和終端
- OCR識(shí)別模型的確定方法及裝置
- 基于聯(lián)邦OCR模型的字符檢測(cè)方法、裝置、設(shè)備和介質(zhì)
- OCR系統(tǒng)的評(píng)估方法、裝置、設(shè)備及可讀存儲(chǔ)介質(zhì)
- OCR模型訓(xùn)練方法、系統(tǒng)及裝置
- 識(shí)別轉(zhuǎn)換圖像文件的方法、系統(tǒng)、計(jì)算機(jī)設(shè)備及存儲(chǔ)介質(zhì)
- OCR訓(xùn)練數(shù)據(jù)生成方法、裝置、計(jì)算機(jī)設(shè)備及存儲(chǔ)介質(zhì)
- 財(cái)務(wù)報(bào)表查詢方法、系統(tǒng)和服務(wù)器
- 財(cái)務(wù)報(bào)表分析方法、系統(tǒng)及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)
- 財(cái)務(wù)數(shù)據(jù)的核對(duì)方法、裝置、計(jì)算機(jī)設(shè)備及存儲(chǔ)介質(zhì)
- 財(cái)務(wù)報(bào)表數(shù)據(jù)處理方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)
- 一種財(cái)務(wù)數(shù)據(jù)的清洗方法、設(shè)備及存儲(chǔ)介質(zhì)
- 一種基于區(qū)塊鏈的財(cái)務(wù)報(bào)表生成方法、裝置、設(shè)備及介質(zhì)
- 一種外部財(cái)務(wù)軟件的數(shù)據(jù)整合系統(tǒng)的工作方法
- 一種財(cái)務(wù)報(bào)表整合及展現(xiàn)方法
- 財(cái)務(wù)報(bào)表處理方法、裝置以及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)
- 一種智能財(cái)務(wù)報(bào)表分類整理裝置
- 信息記錄介質(zhì)、信息記錄方法、信息記錄設(shè)備、信息再現(xiàn)方法和信息再現(xiàn)設(shè)備
- 信息記錄裝置、信息記錄方法、信息記錄介質(zhì)、信息復(fù)制裝置和信息復(fù)制方法
- 信息記錄裝置、信息再現(xiàn)裝置、信息記錄方法、信息再現(xiàn)方法、信息記錄程序、信息再現(xiàn)程序、以及信息記錄介質(zhì)
- 信息記錄裝置、信息再現(xiàn)裝置、信息記錄方法、信息再現(xiàn)方法、信息記錄程序、信息再現(xiàn)程序、以及信息記錄介質(zhì)
- 信息記錄設(shè)備、信息重放設(shè)備、信息記錄方法、信息重放方法、以及信息記錄介質(zhì)
- 信息存儲(chǔ)介質(zhì)、信息記錄方法、信息重放方法、信息記錄設(shè)備、以及信息重放設(shè)備
- 信息存儲(chǔ)介質(zhì)、信息記錄方法、信息回放方法、信息記錄設(shè)備和信息回放設(shè)備
- 信息記錄介質(zhì)、信息記錄方法、信息記錄裝置、信息再現(xiàn)方法和信息再現(xiàn)裝置
- 信息終端,信息終端的信息呈現(xiàn)方法和信息呈現(xiàn)程序
- 信息創(chuàng)建、信息發(fā)送方法及信息創(chuàng)建、信息發(fā)送裝置





