[發明專利]報表解析方法、裝置、電子設備及存儲介質在審
| 申請號: | 202310405431.5 | 申請日: | 2023-04-17 |
| 公開(公告)號: | CN116415563A | 公開(公告)日: | 2023-07-11 |
| 發明(設計)人: | 周展博;邱玉華;郭聰穎;吳琪 | 申請(專利權)人: | 中國工商銀行股份有限公司 |
| 主分類號: | G06F40/205 | 分類號: | G06F40/205;G06F40/289;G06F40/18;G06F16/22;G06F16/28;G06F18/22 |
| 代理公司: | 中科專利商標代理有限責任公司 11021 | 代理人: | 張博 |
| 地址: | 100140 北*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 報表 解析 方法 裝置 電子設備 存儲 介質 | ||
本公開提供了一種報表解析方法、裝置、電子設備及存儲介質,可以應用于大數據技術領域。該方法包括:將監管報表輸入分詞級的預訓練語言模型中,對監管報表進行字段解析,輸出解析信息和多個分類字段;基于解析信息確定監管報表的解析狀態;在解析狀態為正常狀態的情況下,基于多個分類字段和報表字段映射表,確定監管報表中每個分類字段對應的字段映射方案;將多個字段映射方案寫入監管報表中,生成解析報表。
技術領域
本公開涉及大數據技術領域,尤其涉及一種報表解析方法、裝置、電子設備、存儲介質和程序產品。
背景技術
近年來,監管報送項目呈精細化、具體化的趨勢。監管報送具體涉及多家分支機構的統計人員對報表進行填報和審核,每期報表均需消耗較大的人力和時間。相關技術中,通過引入RPA(Robotic?Process?Automation,機器人流程自動化)技術來模擬人工操作業務軟件的流程,實現對報表進行復核、解析以及上報等工作。
在實現本公開構思的過程中,發明人發現相關技術中至少存在如下問題,在對報表解析過程中,對報表字段的識別精準率較低,且不便于基于報表的實時解析狀態對其進行針對性處理,使得報表解析效率較低。
發明內容
鑒于上述問題,本公開提供了一種報表解析方法、裝置、電子設備、存儲介質和程序產品。
根據本公開的第一個方面,提供了一種報表解析方法,包括:將監管報表輸入分詞級的預訓練語言模型中,對上述監管報表進行字段解析,輸出解析信息和多個分類字段;基于上述解析信息確定上述監管報表的解析狀態;在上述解析狀態為正常狀態的情況下,基于多個上述分類字段和報表字段映射表,確定上述監管報表中每個上述分類字段對應的字段映射方案;將多個上述字段映射方案寫入上述監管報表中,生成解析報表。
根據本公開的實施例,上述方法還包括:在上述解析狀態為異常狀態的情況下,基于上述解析信息確定上述監管報文的解析次數;在上述解析次數小于或等于預設次數的情況下,利用上述預訓練語言模型對上述監管報文迭代進行字段解析,輸出新的解析信息和多個新的分類字段;在上述新的解析信息中上述監管報表的解析狀態為正常狀態的情況下,基于上述新的分類字段確定上述監管報表的字段映射方案。
根據本公開的實施例,上述方法還包括:在上述解析次數大于預設次數的情況下,對上述解析信息進行可視化展示;獲取用戶基于上述解析信息輸入的上述監管報表對應的異常字段映射方案;將上述異常字段映射方案存儲至上述報表字段映射表中。
根據本公開的實施例,上述基于多個上述分類字段和報表字段映射表,確定上述監管報表中每個上述分類字段對應的字段映射方案,包括:利用協同過濾算法確定上述報表字段映射表中與上述分類字段相似度最高的報表字段;確定上述報表字段對應的字段映射方案。
根據本公開的實施例,上述將多個上述字段映射方案寫入上述監管報表中,生成解析報表,包括:將上述字段映射方案轉化為字段邏輯關系;將上述字段邏輯關系寫入上述監管報表對應的上述分類字段中,生成解析報表。
根據本公開的實施例,上述方法還包括:將上述解析信息存儲至報表解析狀態明細表中;對上述報表解析狀態明細表和上述報表字段映射表進行可視化展示。
根據本公開的實施例,上述解析信息包括以下至少一種:上述監管報表的監管報表名、解析開始時間、解析結束時間、報表解析時長、報表解析狀態、報表解析次數、處理數據量級別、數據處理的服務器網絡地址。
根據本公開的實施例,在上述將監管報表輸入分詞級的預訓練語言模型中之前,還包括:在上述監管報表中文本的文本長度大于預設長度的情況下,對大于上述預設長度的長文本進行預處理,得到文本長度小于或等于上述預設長度的多個短文本。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國工商銀行股份有限公司,未經中國工商銀行股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202310405431.5/2.html,轉載請聲明來源鉆瓜專利網。





