[發明專利]文件解析方法和裝置有效
| 申請號: | 201611208306.1 | 申請日: | 2016-12-23 |
| 公開(公告)號: | CN108241642B | 公開(公告)日: | 2021-03-30 |
| 發明(設計)人: | 王緒 | 申請(專利權)人: | 北京國雙科技有限公司 |
| 主分類號: | G06F16/25 | 分類號: | G06F16/25;G06F16/22 |
| 代理公司: | 北京康信知識產權代理有限責任公司 11240 | 代理人: | 韓建偉;張永明 |
| 地址: | 100083 北京市海淀區*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 文件 解析 方法 裝置 | ||
本發明公開了一種文件解析方法和裝置。其中,該方法包括:獲取存儲有待解析文件的模板文件,模板文件中具有存儲待解析文件的行含義或者列含義的預設存儲單元;從預設存儲單元中獲取待解析文件的行含義或者列含義;根據獲取的待解析文件的行含義或者列含義,對待解析文件進行解析。本發明解決了由于相關技術中通過索引來解析對應列的數據對使用人員要求高,易于出錯的技術問題。
技術領域
本發明涉及數據處理技術領域,具體而言,涉及一種文件解析方法和裝置。
背景技術
隨著互聯網技術的進步,特別是針對不同客戶對網絡服務的需求,產生了各種服務互聯網需求的應用技術,其中,相關技術中通過使用逗號分隔型取值格式(CommaSeparated Values,簡稱CSV)文件實現與媒體端之間的信息傳輸。
在使用相關技術時,現在解析CSV文件是通過索引來解析對應列的數據,這樣使用人員必須記住每個列所代表的具體含義,如果記錯誤了就會導致上傳的數據出錯或者直接上傳失敗,進而導致解析結果出錯。如果有需求變化,需要在指定的地方添加新的列,那么原來按照列解析的順序就需要全部修改,不利于開發人員對于代碼的維護。
針對上述由于相關技術中通過索引來解析對應列的數據對使用人員要求高,易于出錯的問題,目前尚未提出有效的解決方案。
發明內容
本發明實施例提供了一種文件解析方法和裝置,以至少解決由于相關技術中通過索引來解析對應列的數據對使用人員要求高,易于出錯的技術問題。
根據本發明實施例的一個方面,提供了一種文件解析方法,包括:獲取存儲有待解析文件的模板文件,模板文件中具有存儲待解析文件的行含義或者列含義的預設存儲單元;從預設存儲單元中獲取待解析文件的行含義或者列含義;根據獲取的待解析文件的行含義或者列含義,對待解析文件進行解析。
可選的,預設存儲單元為列頭或行頭。
可選的,在對待解析文件進行解析后,該方法還包括:將解析后所得到的數據導入預設數據庫。
進一步地,可選的,在將解析后所得到的數據導入預設數據庫之前,該方法還包括:接收數據處理指令,數據處理指令中包含數據處理方式及數據處理速度;按照數據處理指令中的數據處理方式及數據處理速度讀取數據;將讀取的數據賦值給預設數據結構,以通過預設數據結構將數據導入預設數據庫。
可選的,在獲取存儲有待解析文件的模板文件之前,該方法還包括:獲取待解析文件的數據存儲格式;判斷待解析文件的數據存儲格式與模板文件是否相同;如果待解析文件的數據存儲格式與模板文件不同,則在待解析文件中插入預設存儲單元,并定義預設存儲單元用于存儲待解析文件的行含義或者列含義,以將待解析文件的數據存儲格式轉換為與模板文件相同;或者,將待解析文件導入模板文件,并在模板文件的預設存儲單元中填寫待解析文件的行含義或者列含義。
根據本發明實施例的另一個方面,提供了一種文件解析裝置,包括:獲取模塊,用于獲取存儲有待解析文件的模板文件,模板文件中具有存儲待解析文件的行含義或者列含義的預設存儲單元;提取模塊,用于從預設存儲單元中獲取待解析文件的行含義或者列含義;解析模塊,用于根據獲取的待解析文件的行含義或者列含義,對待解析文件進行解析。
可選的,預設存儲單元為列頭或行頭。
可選的,該裝置還包括:導入模塊,用于在對待解析文件進行解析后,將解析后所得到的數據導入預設數據庫。
進一步地,可選的,該裝置還包括:接收模塊,用于在將解析后所得到的數據導入預設數據庫之前,接收數據處理指令,數據處理指令中包含數據處理方式及數據處理速度;讀取模塊,用于按照數據處理指令中的數據處理方式及數據處理速度讀取數據;賦值模塊,用于將讀取的數據賦值給預設數據結構,以通過預設數據結構將數據導入預設數據庫。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京國雙科技有限公司,未經北京國雙科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201611208306.1/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種分布式數據庫的操作方法
- 下一篇:關鍵詞的指標數據分析方法及裝置





