[發(fā)明專利]一種基于深度學(xué)習(xí)框架的財務(wù)報表自動識別方法在審
| 申請?zhí)枺?/td> | 202010571056.8 | 申請日: | 2020-06-22 |
| 公開(公告)號: | CN111814598A | 公開(公告)日: | 2020-10-23 |
| 發(fā)明(設(shè)計)人: | 楊玉東;張麗影;任昊;劉春影;楊茜 | 申請(專利權(quán))人: | 吉林省通聯(lián)信用服務(wù)有限公司 |
| 主分類號: | G06K9/00 | 分類號: | G06K9/00;G06K9/32 |
| 代理公司: | 長春眾邦菁華知識產(chǎn)權(quán)代理有限公司 22214 | 代理人: | 于曉慶 |
| 地址: | 130000 吉林省長春市*** | 國省代碼: | 吉林;22 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 深度 學(xué)習(xí) 框架 財務(wù)報表 自動識別 方法 | ||
一種基于深度學(xué)習(xí)框架的財務(wù)報表自動識別方法,涉及計算機(jī)視覺識別領(lǐng)域,解決了人工識別存在的成本過高、易疲勞、易疏忽、效率低、準(zhǔn)確率低的問題。本發(fā)明包括:接收財務(wù)報表圖像;霍夫直線法進(jìn)行圖像校正,調(diào)整表格至水平狀態(tài);OCR文本自動識別:采用基于深度學(xué)習(xí)網(wǎng)絡(luò)的圖像識別模型依次識別財務(wù)報表圖像中的文本所在位置和具體內(nèi)容,提取出整張表格的信息;基于圖像形態(tài)學(xué)檢測表格線,并提取單元格位置坐標(biāo);生成Excel文件。本發(fā)明能夠自動識別財務(wù)報表中的文本位置、文本內(nèi)容以及報表中的表格線,最終輸出與原財務(wù)報表圖像邏輯結(jié)構(gòu)和文本內(nèi)容相一致的Excel文件,以達(dá)到降低財務(wù)報表識別成本、提高識別工作效率和準(zhǔn)確率的目的。
技術(shù)領(lǐng)域
本發(fā)明涉及計算機(jī)視覺識別技術(shù)領(lǐng)域,具體涉及一種基于深度學(xué)習(xí)框架的財務(wù)報表自動識別方法。
背景技術(shù)
隨著社會經(jīng)濟(jì)的快速發(fā)展,企業(yè)的發(fā)展規(guī)模不斷擴(kuò)大,導(dǎo)致其融資需求隨之增加,而財務(wù)報表數(shù)據(jù)能夠直接、客觀地反映企業(yè)的經(jīng)營能力、盈利能力、償債能力以及成長能力,在企業(yè)向銀行遞交融資申請時,被作為重要的資格審核依據(jù)。因此,促使銀行對財務(wù)報表的識別需求也越來越大。目前,現(xiàn)有的財務(wù)報表識別主要是通過人工方式進(jìn)行,人工識別方法所耗時間成本、人力成本均相對較高,效率低下,且人工識別的長時間重復(fù)性操作容易造成疲勞,進(jìn)而引發(fā)誤差、疏忽、漏項等問題,致使財務(wù)報表識別結(jié)果的準(zhǔn)確率偏低。
如何準(zhǔn)確、高效地識別財務(wù)報表,同時避免人工識別成本過高、易疲勞、易疏忽等弊端,是目前亟待解決的技術(shù)問題。
發(fā)明內(nèi)容
為解決目前人工識別財務(wù)報表存在的成本過高、易疲勞、易疏忽、效率低、準(zhǔn)確率低的問題,本發(fā)明提出一種基于深度學(xué)習(xí)框架的財務(wù)報表自動識別方法,其能夠自動識別財務(wù)報表中的文本位置、文本內(nèi)容以及報表中的表格線,最終輸出與原財務(wù)報表圖像邏輯結(jié)構(gòu)和文本內(nèi)容相一致的Excel文件,以達(dá)到降低財務(wù)報表識別成本、提高識別工作效率和準(zhǔn)確率的目的。
本發(fā)明為解決技術(shù)問題所采用的技術(shù)方案如下:
本發(fā)明的一種基于深度學(xué)習(xí)框架的財務(wù)報表自動識別方法,包括以下步驟:
S1、接收財務(wù)報表圖像;
S2、基于霍夫直線法對財務(wù)報表圖像進(jìn)行圖像校正,調(diào)整表格至水平狀態(tài);
S3、OCR文本自動識別:采用基于深度學(xué)習(xí)網(wǎng)絡(luò)的圖像識別模型依次識別財務(wù)報表圖像中的文本所在位置和具體內(nèi)容,提取出整張表格的信息;
S4、基于圖像形態(tài)學(xué)檢測表格線,并提取單元格位置坐標(biāo);
S5、生成并輸出Excel文件。
進(jìn)一步的,步驟S1具體包括以下步驟:
S11、準(zhǔn)備財務(wù)報表文件;
S12、使用Python工具中的OpenCV2算法庫接收財務(wù)報表圖像,并統(tǒng)一轉(zhuǎn)化為png格式文件。
進(jìn)一步的,步驟S2具體包括以下步驟:
S21、準(zhǔn)備訓(xùn)練集數(shù)據(jù);
S22、基于霍夫直線法,使用Python工具中的OpenCV2算法庫獲取財務(wù)報表圖像中傾斜角度小于45度的直線;
S23、根據(jù)獲取的直線斜率,計算出平均斜率;
S24、根據(jù)平均斜率對財務(wù)報表圖像進(jìn)行校正,調(diào)整表格至水平狀態(tài);
S25、基于測試集數(shù)據(jù)檢驗有效校正率,有效校正率為99.6%。
進(jìn)一步的,步驟S3具體包括以下步驟:
S31、準(zhǔn)備訓(xùn)練集數(shù)據(jù);
S32、獲取不同位置、不同噪聲下的單元格圖像;
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于吉林省通聯(lián)信用服務(wù)有限公司,未經(jīng)吉林省通聯(lián)信用服務(wù)有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010571056.8/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06K 數(shù)據(jù)識別;數(shù)據(jù)表示;記錄載體;記錄載體的處理
G06K9-00 用于閱讀或識別印刷或書寫字符或者用于識別圖形,例如,指紋的方法或裝置
G06K9-03 .錯誤的檢測或校正,例如,用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標(biāo)記或含有代碼標(biāo)記的打印字符的,例如,由不同形狀的各個筆畫組成的,而且每個筆畫表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理,即無須判定關(guān)于圖像的同一性而進(jìn)行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合
- 根據(jù)用戶學(xué)習(xí)效果動態(tài)變化下載學(xué)習(xí)數(shù)據(jù)的系統(tǒng)及方法
- 用于智能個人化學(xué)習(xí)服務(wù)的方法
- 漸進(jìn)式學(xué)習(xí)管理方法及漸進(jìn)式學(xué)習(xí)系統(tǒng)
- 輔助學(xué)習(xí)的方法及裝置
- 基于人工智能的課程推薦方法、裝置、設(shè)備及存儲介質(zhì)
- 基于強(qiáng)化學(xué)習(xí)的自適應(yīng)移動學(xué)習(xí)路徑生成方法
- 一種線上視頻學(xué)習(xí)系統(tǒng)
- 一種基于校園大數(shù)據(jù)的自適應(yīng)學(xué)習(xí)方法、裝置及設(shè)備
- 一種學(xué)習(xí)方案推薦方法、裝置、設(shè)備和存儲介質(zhì)
- 游戲?qū)W習(xí)效果評測方法及系統(tǒng)





