[發明專利]XML文件處理方法、設備和存儲介質有效
| 申請號: | 201810666574.0 | 申請日: | 2018-06-26 |
| 公開(公告)號: | CN109241498B | 公開(公告)日: | 2023-08-15 |
| 發明(設計)人: | 劉正;趙繼光 | 申請(專利權)人: | 中國建設銀行股份有限公司 |
| 主分類號: | G06F40/151 | 分類號: | G06F40/151;G06F40/14;H03M7/30;G06F16/84 |
| 代理公司: | 廣州三環專利商標代理有限公司 44202 | 代理人: | 郝傳鑫 |
| 地址: | 100032 *** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | xml 文件 處理 方法 設備 存儲 介質 | ||
本公開提供了一種XML文件處理方法,包括:接收待壓縮的XML報文和所述XML報文對應的交易服務編碼;將所述XML報文解析為Xpath表達式和元素值;查詢是否存在與所接收的交易服務編碼匹配的報文壓縮模板,若否,則將所接收的交易服務編碼和解析出的Xpath表達式和元素值存儲到數據庫作為報文壓縮模板,根據預定壓縮規則生成壓縮字符串;若是,則根據預定壓縮規則生成壓縮字符串,并在解析出的Xpath表達式與匹配的報文壓縮模板中的Xpath表達式不相同時,更新數據庫中的報文壓縮模板表。本申請的方法,能夠提高XML文件壓縮的效率。
技術領域
本發明涉及數據處理領域,更為具體而言,涉及一種XML文件處理方法、設備和存儲介質。
背景技術
當前大型系統的海量報文數據是企業信息化過程中產生的重要資源,是大數據分析和自動化測試以及生產問題跟蹤定位的重要資料之一,但也由于數量巨大造成了傳輸、查詢、存儲、使用等方面的一些問題,尤其是比較常用的可擴展標記語言(eXtensibleMarkup?Language,XML)報文,其本身具有標簽和數據冗余量大的特點,且由于同一個交易服務所產生XML報文的結構和數據相同或相近,因此造成了更多的冗余數據被傳輸和存儲,XML報文壓縮技術是解決此問題的一個途徑。
現有的xml壓縮算法工具如XMLPPM、XWRT、XGRIND等更加適合規模較大的xml文檔的壓縮,而軟件系統的xml報文一般都很小,沒有考慮軟件系統的XML自身的特征,導致這些算法復雜性較高而且壓縮效率不高。
發明內容
本發明提供了一種XML文件處理方法,考慮到軟件系統的XML報文一般較小,而且冗余度較高,將XML文檔解析為Xpath路徑表達式,并為Xpath?表達式進行編號,形成列表作為模板保存,將XML文檔壓縮為Xpath編號和對應元素值的列表,顯著提高了軟件系統的XML文件的壓縮效率。
第一方面,本發明實施方式提供了一種XML文件處理方法,包括:接收待壓縮的XML報文和所述XML報文對應的交易服務編碼;將所述XML報文解析為Xpath表達式和元素值,其中,所述Xpath表達式為表示所述XML?文件中節點路徑的表達式;查詢是否存在與所接收的交易服務編碼匹配的報文壓縮模板,若未查詢到匹配的報文壓縮模板,則將所接收的交易服務編碼和解析出的Xpath表達式和元素值存儲到數據庫作為報文壓縮模板,根據預定壓縮規則生成壓縮字符串;若查詢到匹配的報文壓縮模板,則根據預定壓縮規則生成壓縮字符串,并在所述解析出的Xpath表達式與匹配的報文壓縮模板中的Xpath表達式不相同時,更新所述數據庫中的報文壓縮模板表。
第二方面,本發明實施方式提供一種計算機設備,包括存儲器和處理器,其中,所述存儲器,存儲有計算機指令;所述處理器,配置為執行所述計算機指令以使所述計算機設備實現第一方面所述的方法。
第三方面,本發明實施方式提供一種計算機可讀的存儲介質,其上存儲有計算機指令,所述計算機指令被處理器執行時實現第一方面所述的方法。
附圖說明
圖1示出了根據本發明實施方式的XML文件處理方法的流程示意圖。
圖2示出了根據本發明實施方式的XML文件處理方法的代碼截圖。
圖3示出了根據本發明實施方式的XML文件處理方法的代碼截圖。
圖4示出了根據本發明實施方式的XML文件處理方法的代碼截圖。
圖5示出了根據本發明實施方式的XML文件處理方法的代碼截圖。
圖6示出了根據本發明實施方式的XML文件處理方法的代碼截圖。
圖7示出了根據本發明實施方式的XML文件處理方法的代碼截圖。
圖8示出了根據本發明實施方式的XML文件處理方法的代碼截圖。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國建設銀行股份有限公司,未經中國建設銀行股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810666574.0/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:文本處理方法及裝置
- 下一篇:一種在線圖文轉換方法





