[發明專利]一種數據處理的方法及裝置、電子設備、存儲介質在審
| 申請號: | 202010291796.6 | 申請日: | 2020-04-14 |
| 公開(公告)號: | CN111611788A | 公開(公告)日: | 2020-09-01 |
| 發明(設計)人: | 陳燦輝 | 申請(專利權)人: | 大唐軟件技術股份有限公司 |
| 主分類號: | G06F40/205 | 分類號: | G06F40/205;G06F40/226;G06F16/16 |
| 代理公司: | 北京潤澤恒知識產權代理有限公司 11319 | 代理人: | 莎日娜 |
| 地址: | 100094 北京市*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 數據處理 方法 裝置 電子設備 存儲 介質 | ||
本申請實施例提供了一種數據處理的方法及裝置、電子設備、存儲介質,所述方法包括:獲取待解析的文本文件和解析模板;所述解析模板包括針對所述文本文件進行解析操作的配置信息;按照所述配置信息,對所述文本文件執行所述解析操作,得到一個或多個目標數據;采用所述一個或多個目標數據,生成解析結果數據,實現了在文本解析過程中,同時提取多個目標數據,提高了文本解析效率。
技術領域
本申請涉及計算機技術領域,特別是涉及一種數據處理的方法及裝置、電子設備、存儲介質。
背景技術
在現有技術中,可以對采集到的文本數據進行提取,獲取特定的內容。在進行數據提取時,可以采用正則表達式對目標內容進行提取。
然而,正則表達式語法復雜晦澀難懂,在使用正則表達式過程中,僅能實現對目標的匹配和提取,無法對提取后的數據進行靈活處理和格式化輸出,在復雜規則中效率較低。
發明內容
鑒于上述問題,提出了以便提供克服上述問題或者至少部分地解決上述問題的一種數據處理的方法及裝置、電子設備、存儲介質,包括:
一種數據處理的方法,所述方法包括:
獲取待解析的文本文件和解析模板;所述解析模板包括針對所述文本文件進行解析操作的配置信息;
按照所述配置信息,對所述文本文件執行所述解析操作,得到一個或多個目標數據;
采用所述一個或多個目標數據,生成解析結果數據。
可選地,所述按照所述配置信息,對所述文本文件執行所述解析操作,得到一個或多個目標數據的步驟,包括:
生成針對所述文本文件的指針;
確定所述指針的當前位置信息;
當所述配置信息包括提取操作信息時,確定所述提取操作信息對應的提取范圍信息;
采用所述提取范圍信息和所述當前位置信息,對所述文本文件執行所述解析操作,得到一個或多個目標數據。
可選地,所述確定所述指針的當前位置信息的步驟,包括:
當所述配置信息包括定位操作信息時,確定所述定位操作信息對應的目標字符串;
判斷所述文本文件是否包含所述目標字符串;
當所述文本文件包含所述目標字符串,確定所述目標字符串對應的目標位置信息;
將所述目標位置信息確定為所述指針的當前位置信息。
可選地,所述確定所述指針的當前位置信息的步驟,包括:
當所述配置信息包括移動操作信息時,確定所述移動操作信息對應的移動方式信息;
確定所述指針的初始位置信息;
采用所述初始位置信息和所述移動方式信息,確定所述指針的當前位置信息。
可選地,所述采用所述提取范圍信息和所述當前位置信息,對所述文本文件執行所述解析操作,得到一個或多個目標數據的步驟包括:
采用所述提取范圍信息和所述當前位置信息,對所述文本文件執行數據提取操作,得到一個或多個待修改數據;
當所述配置信息包括數據修改信息時,采用所述數據修改信息對所述一個或多個待修改數據進行修改,得到一個或多個目標數據。
可選地,所述數據修改信息為數據替換信息,所述采用所述數據修改信息對所述一個或多個待修改數據進行修改,得到一個或多個目標數據的步驟,包括:
確定針對所述一個或多個待處理數據的替換數據;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于大唐軟件技術股份有限公司,未經大唐軟件技術股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010291796.6/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種電子裝置和條碼采集方法
- 下一篇:一種通信信號時頻域的檢測方法





