[發(fā)明專利]基于人工智能的文件數(shù)據(jù)處理方法、裝置、設備和介質(zhì)在審
| 申請?zhí)枺?/td> | 202010711056.3 | 申請日: | 2020-07-22 |
| 公開(公告)號: | CN111858467A | 公開(公告)日: | 2020-10-30 |
| 發(fā)明(設計)人: | 謝建軍 | 申請(專利權(quán))人: | 平安證券股份有限公司 |
| 主分類號: | G06F16/11 | 分類號: | G06F16/11;G06F16/25 |
| 代理公司: | 廣州華進聯(lián)合專利商標代理有限公司 44224 | 代理人: | 李文淵 |
| 地址: | 518048 廣東省深圳市福田*** | 國省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 人工智能 文件 數(shù)據(jù)處理 方法 裝置 設備 介質(zhì) | ||
本申請涉及人工智能領域,特別是涉及一種基于人工智能的文件數(shù)據(jù)處理方法、裝置、設備和介質(zhì)。所述方法包括:獲取待處理文件數(shù)據(jù),并分別對各待處理文件數(shù)據(jù)進行文件格式的識別,確定各待處理文件數(shù)據(jù)的文件格式;根據(jù)各待處理文件數(shù)據(jù)的文件格式獲取對應的配置數(shù)據(jù);獲取接口數(shù)據(jù),并通過接口數(shù)據(jù)以及各配置數(shù)據(jù),分別生成對應各待處理文件數(shù)據(jù)的識別程序;通過各識別程序分別對各待處理文件數(shù)據(jù)分別進行數(shù)據(jù)內(nèi)容的識別,得到各待處理文件數(shù)據(jù)中的數(shù)據(jù)內(nèi)容;將各數(shù)據(jù)內(nèi)容存入數(shù)據(jù)庫中。采用本方法能夠提升數(shù)據(jù)處理效率。同時,本申請還涉及區(qū)塊鏈技術,其中,將待處理文件數(shù)據(jù)、文件格式、配置數(shù)據(jù)以及數(shù)據(jù)內(nèi)容等均可以存儲與區(qū)塊鏈中。
技術領域
本申請涉及人工智能領域,特別是涉及一種基于人工智能的文件數(shù)據(jù)處理方法、裝置、設備和介質(zhì)。
背景技術
證券公司通過其核心交易系統(tǒng)、清算系統(tǒng)等與外部機構(gòu)(如證券登記結(jié)算公司、托管銀行等)之間等進行文件數(shù)據(jù)的交互,例如,交易系統(tǒng)通過導出和導入接口文件實現(xiàn)與登記公司、基金公司、存管銀行等進行數(shù)據(jù)交互等。
在傳統(tǒng)方式中,證券公司需要通過不同的接口對不同文件格式的文件數(shù)據(jù)進行識別轉(zhuǎn)換。由于不同文件格式的文件數(shù)據(jù)均需要通過不同的接口處理,使得數(shù)據(jù)處理的效率較低。
發(fā)明內(nèi)容
基于此,有必要針對上述技術問題,提供一種能夠提升數(shù)據(jù)處理效率的基于人工智能的文件數(shù)據(jù)處理方法、裝置、設備和介質(zhì)。
一種基于人工智能的文件數(shù)據(jù)處理方法,所述方法包括:
獲取待處理文件數(shù)據(jù),并分別對各待處理文件數(shù)據(jù)進行文件格式的識別,確定各待處理文件數(shù)據(jù)的文件格式;
根據(jù)各待處理文件數(shù)據(jù)的文件格式獲取對應的配置數(shù)據(jù);
獲取接口數(shù)據(jù),并通過接口數(shù)據(jù)以及各配置數(shù)據(jù),分別生成對應各待處理文件數(shù)據(jù)的識別程序;
通過各識別程序分別對各待處理文件數(shù)據(jù)分別進行數(shù)據(jù)內(nèi)容的識別,得到各待處理文件數(shù)據(jù)中的數(shù)據(jù)內(nèi)容;
將各數(shù)據(jù)內(nèi)容存入數(shù)據(jù)庫中。
在其中一個實施例中,對各待處理文件數(shù)據(jù)進行文件格式的識別,確定各待處理文件數(shù)據(jù)的文件格式,包括:
判斷待處理文件數(shù)據(jù)是否存在文件后綴;
當待處理文件數(shù)據(jù)存在文件后綴時,則根據(jù)文件后綴確定待處理文件數(shù)據(jù)的文件格式;
當待處理文件數(shù)據(jù)不存在文件后綴時,則對待處理文件數(shù)據(jù)的文件頭標識、文件描述、文件結(jié)構(gòu)以及存儲結(jié)構(gòu)中至少一項進行識別,以確定待處理文件數(shù)據(jù)的文件格式。
在其中一個實施例中,通過各識別程序分別對各待處理文件數(shù)據(jù)分別進行數(shù)據(jù)內(nèi)容的識別,得到各待處理文件數(shù)據(jù)中的數(shù)據(jù)內(nèi)容,包括:
對待處理文件數(shù)據(jù)的各數(shù)據(jù)條目分別進行文本字符串的識別,得到待處理文件數(shù)據(jù)中對應各數(shù)據(jù)條目的初始數(shù)據(jù)內(nèi)容;
分別對各數(shù)據(jù)條目對應的初始數(shù)據(jù)內(nèi)容進行內(nèi)容格式標準化的預處理,以得到待處理文件數(shù)據(jù)中各數(shù)據(jù)條目的數(shù)據(jù)內(nèi)容。
在其中一個實施例中,得到各待處理文件數(shù)據(jù)中的數(shù)據(jù)內(nèi)容之后,方法還包括:
判斷得到的數(shù)據(jù)內(nèi)容是否符合數(shù)據(jù)庫的存儲要求;
當數(shù)據(jù)內(nèi)容不符合數(shù)據(jù)庫的存儲要求時,則通過轉(zhuǎn)換函數(shù)對數(shù)據(jù)內(nèi)容進行存儲格式的轉(zhuǎn)換,得到符合數(shù)據(jù)庫的存儲要求的數(shù)據(jù)內(nèi)容。
在其中一個實施例中,將各數(shù)據(jù)內(nèi)容存入數(shù)據(jù)庫中,包括:
并行將各待處理文件數(shù)據(jù)的內(nèi)容數(shù)據(jù)存入緩存數(shù)據(jù)庫中;
異步從緩存數(shù)據(jù)庫中獲取各待處理文件數(shù)據(jù)的數(shù)據(jù)內(nèi)容,并存入管理數(shù)據(jù)庫中。
該專利技術資料僅供研究查看技術是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于平安證券股份有限公司,未經(jīng)平安證券股份有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010711056.3/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 數(shù)據(jù)處理設備,數(shù)據(jù)處理方法,和數(shù)據(jù)處理程序
- 數(shù)據(jù)處理電路、數(shù)據(jù)處理裝置、數(shù)據(jù)處理方法、數(shù)據(jù)處理控制方法
- 數(shù)據(jù)處理設備、數(shù)據(jù)處理方法和數(shù)據(jù)處理程序
- 數(shù)據(jù)處理裝置、數(shù)據(jù)處理方法及數(shù)據(jù)處理程序
- 數(shù)據(jù)處理裝置、數(shù)據(jù)處理方法及計算機可讀取的記錄介質(zhì)
- 數(shù)據(jù)處理裝置、數(shù)據(jù)處理方法和數(shù)據(jù)處理程序
- 數(shù)據(jù)處理裝置、數(shù)據(jù)處理方法和數(shù)據(jù)處理程序
- 數(shù)據(jù)處理裝置、數(shù)據(jù)處理方法以及數(shù)據(jù)處理程序
- 數(shù)據(jù)處理裝置、數(shù)據(jù)處理方法以及數(shù)據(jù)處理程序
- 數(shù)據(jù)處理裝置、數(shù)據(jù)處理方法和數(shù)據(jù)處理程序





