[發明專利]財務報表重建方法、裝置、計算機設備和介質在審
| 申請號: | 202310256251.5 | 申請日: | 2023-03-16 |
| 公開(公告)號: | CN116311304A | 公開(公告)日: | 2023-06-23 |
| 發明(設計)人: | 石朵偉;陳淑華;陳嘉裕 | 申請(專利權)人: | 深圳前海環融聯易信息科技服務有限公司 |
| 主分類號: | G06V30/412 | 分類號: | G06V30/412;G06V30/14;G06V30/146;G06V30/148;G06V30/19;G06Q40/12 |
| 代理公司: | 深圳眾鼎匯成知識產權代理有限公司 44566 | 代理人: | 朱業剛 |
| 地址: | 518000 廣東省深圳市前海深港合作區前*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 財務報表 重建 方法 裝置 計算機 設備 介質 | ||
本申請人工智能技術領域,提供了一種財務報表重建方法、裝置、計算機設備和介質,用于提高對當前的財務報表的識別通用性。方法部分包括:識別財務報表圖像中,位于無線表格內的所有單行文本框;確定所述所有單行文本框中,位于目標列的目標單行文本框,其中,所述目標列包括項目列和金額列;對每種所述目標列的所有單行文本框的寬度進行排序;根據每種所述目標列的排序結果,對應獲取每種所述目標列的列分割線;比較不同所述目標列的單行文本框的縱坐標值,以獲取行匹配關系;按照所述列分割線以及所述行匹配關系,生成有線表格。
技術領域
本申請涉及人工智能技術領域,尤其涉及一種財務報表重建方法、裝置、計算機設備和存儲介質。
背景技術
財務報表中包含資產負債表、損益表、現金流量表三類表,全面系統地揭示企業一定時期的財務狀況、經營成果和現金流量。
為了提供財務報表數據的采集工作,財務報表識別技術得到快速發展,一般是通過圖像處理技術手段,提取財務報表數據。其中,財務報表中的數據類型和呈現形式多樣,現有的技術僅是針對固有的數據呈現形式訓練特定模型用于識別,對當前的財務報表的識別缺乏通用性。
發明內容
基于此,有必要針對上述技術問題,提供一種財務報表重建方法、裝置、計算機設備和存儲介質,以提高對當前的財務報表的識別通用性。
第一方面,提供了一種財務報表重建方法,所述方法包括:
識別財務報表圖像中,位于無線表格內的所有單行文本框;
確定所述所有單行文本框中,位于目標列的目標單行文本框,其中,所述目標列包括項目列和金額列;
對每種所述目標列的所有單行文本框的寬度進行排序;
根據每種所述目標列的排序結果,對應獲取每種所述目標列的列分割線;
比較不同所述目標列的單行文本框的縱坐標值,以獲取行匹配關系;
按照所述列分割線以及所述行匹配關系,生成有線表格。
在一種實現中,所述識別財務報表圖像中,位于無線表格內的單行文本框,包括:
對所述財務報表圖像進行預處理,得到目標財務報表圖像;
將所述目標財務報表圖像輸入yolov5s檢測模型,以檢測出所述財務報表圖像中的無線表格的坐標位置;
將所述目標財務報表圖像輸入文本DBNet模型,以檢測出所述財務報表圖像中所有單行文本框的坐標位置;
根據所述無線表格和所述單行文本框的坐標位置,標記出位于所述無線表格的單行文本框。
在一種實現中,所述根據所述無線表格和所述單行文本框的坐標位置,標記出位于所述無線表格的單行文本框,包括:
利用所述無線表格的坐標位置計算所述無線表格的區域面積,并利用所述單行文本框的坐標位置計算所述單行文本框的區域面積;
根據所述無線表格的區域面積,和所述單行文本框的區域面積,計算所述單行文本框的重疊度IOU值;
將所述IOU值大于預設值的所述單行文本框,標記為位于所述無線表格的單行文本框。
在一種實現中,所述方法還包括:
識別財務報表圖像中,位于無線表格外的單行文本框;
對所述無線表格外的單行文本框進行縱向排序后,再進行橫向排序插入所述有線表格的最后一行中,得到目標有線表格。
在一種實現中,所述對所述財務報表圖像進行預處理,得到目標財務報表圖像,包括:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于深圳前海環融聯易信息科技服務有限公司,未經深圳前海環融聯易信息科技服務有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202310256251.5/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:朱頂紅組培繁殖方法
- 下一篇:一種變電站消防拍攝機器人





