[發明專利]文件解析方法及裝置有效
| 申請號: | 201710020706.8 | 申請日: | 2017-01-12 |
| 公開(公告)號: | CN106874386B | 公開(公告)日: | 2020-07-28 |
| 發明(設計)人: | 陳曉攀;熊志強;胡偉;梁嘉 | 申請(專利權)人: | 深圳市漢云科技有限公司 |
| 主分類號: | G06F16/16 | 分類號: | G06F16/16;G06F16/178;G06F16/185 |
| 代理公司: | 深圳中一專利商標事務所 44237 | 代理人: | 陽開亮 |
| 地址: | 518000 廣東省深圳市*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 文件 解析 方法 裝置 | ||
本發明適用于數據解析技術領域,提供了一種文件解析方法及裝置,所述解析方法包括:預先配置不同字段解析狀態下讀取到預設特殊字符后所對應執行的文件解析策略;讀取待解析文件中的數據,獲取當前的字段解析狀態;從所述預先配置不同字段解析狀態下讀取到預設特殊字符后所對應執行的文件解析策略中查找出與所述當前的字段解析狀態相匹配的文件解析策略;利用與所述當前的字段解析狀態相匹配的文件解析策略執行相應的文件解析處理流程。本發明可以快速對文件進行解析,保證解析的高效性,并且具有高容錯性,能夠處理不規范的數據。
技術領域
本發明屬于數據解析技術領域,尤其涉及文件解析方法及裝置。
背景技術
現今,不同文本的格式規范各不相同,常見的CSV解析方法嚴重依賴與CSV文件的格式規范,即只能處理常規CSV文件,當CSV文件稍有不規范的地方,就會導致整個文件解析失敗,容錯性低,而為了提高容錯性,會對一行數據進行多次掃描分析,降低解析效率。因此,現有技術中存在著解析文件時無法處理不規范數據,容錯性低,且解析效率低的問題。
發明內容
本發明實施例提供一種文件解析方法及裝置,旨在解決現有技術中解析文件時無法處理不規范數據,容錯性低,且解析效率低的問題。
第一方面,本發明實施例提供了一種文件解析方法,所述解析方法包括:
預先配置不同字段解析狀態下讀取到預設特殊字符后所對應執行的文件解析策略;
讀取待解析文件中的數據,獲取當前的字段解析狀態;
從所述預先配置不同字段解析狀態下讀取到預設特殊字符后所對應執行的文件解析策略中查找出與所述當前的字段解析狀態相匹配的文件解析策略;
利用與所述當前的字段解析狀態相匹配的文件解析策略執行相應的文件解析處理流程。
第二方面,本發明實施例提供了一種文件解析裝置,所述解析裝置包括:
配置模塊,用于預先配置不同字段解析狀態下讀取到預設特殊字符后所對應執行的文件解析策略;
獲取模塊,用于讀取待解析文件中的數據,獲取當前的字段解析狀態;
查找模塊,用于從所述預先配置不同字段解析狀態下讀取到預設特殊字符后所對應執行的文件解析策略中查找出與所述當前的字段解析狀態相匹配的文件解析策略;
執行模塊,用于利用與所述當前的字段解析狀態相匹配的文件解析策略執行相應的文件解析處理流程。
本發明實施例與現有技術相比存在的有益效果是:本發明實施例通過預先配置不同字段解析狀態下讀取到預設特殊字符后所對應執行的文件解析策略;讀取待解析文件中的數據,獲取當前的字段解析狀態;從預先配置不同字段解析狀態下讀取到預設特殊字符后所對應執行的文件解析策略中查找出與當前的字段解析狀態相匹配的文件解析策略;利用與當前的字段解析狀態相匹配的文件解析策略執行相應的文件解析處理流程,從而可以快速對文件進行解析,保證解析的高效性,并且具有高容錯性,能夠處理不規范的數據。
附圖說明
圖1為本發明實施例提供的一種文件解析方法的流程示意圖;
圖2為圖1所示實施例中的步驟S104的細化步驟流程示意圖;
圖3為圖2所示實施例中的步驟S204的細化步驟流程示意圖;
圖4為圖2所示實施例中的步驟S204的另一細化步驟流程示意圖;
圖5為圖1所示實施例中的步驟S104的另一細化步驟流程示意圖;
圖6為本發明實施例提供的一種文件解析裝置的結構示意圖;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于深圳市漢云科技有限公司,未經深圳市漢云科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710020706.8/2.html,轉載請聲明來源鉆瓜專利網。





