[發明專利]文檔格式轉換方法有效
| 申請號: | 201310596651.7 | 申請日: | 2013-11-22 |
| 公開(公告)號: | CN103559322B | 公開(公告)日: | 2017-11-17 |
| 發明(設計)人: | 李祺;戴鑫波 | 申請(專利權)人: | 北大醫療信息技術有限公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 北京友聯知識產權代理事務所(普通合伙)11343 | 代理人: | 尚志峰,汪海屏 |
| 地址: | 100080 北京*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 文檔 格式 轉換 方法 | ||
技術領域
本發明涉及格式轉換技術領域,具體而言,涉及文檔格式轉換方法。
背景技術
HL7(Health Level Seven)是基于國際標準化組織ISO公布的網絡開放系統互連模型OSI第七層(應用層)的醫學信息交換協議。目前,HL7協議已經進展到了第三版,即HL7V3。
在基于HL7V3的醫療系統之間實現醫學信息的交互時,常常涉及到需要將本地生成的二維關系表轉換為XML文件后發送至其他醫療系統,或將接收到的來自其他醫療系統的XML文件轉換為二維關系表后存儲至本地。在相關技術中,主要是采用XML映射法。其中,實現映射的過程一般分為兩部分:配置映射和使用映射關系轉換XML。
XML(Extensible Markup Language,可擴展標記語言)是一種結構化的描述數據語言,由于其開放性與可擴展性,目前被廣泛應用于數據交互和數據存儲方面;XML文檔主要由標簽、標簽值、屬性、屬性值、特殊處理指令、注釋等元素構成。目前,XML的解析技術主要有兩種:SAX(Simple API for XML)和DOM(Document Object Model),兩種技術實現原理不同。SAX基于事件觸發方式進行解析;DOM則將XML文檔一次性的經過DOM解析器解析成一個保存在內存中的對象樹,對XML的隨機操作轉化為對對象樹的操作。因此,總體上目前DOM由于其操作的方便性,基本成為主流XML解析器方法。
在通過操作DOM樹進行XML中的節點定位時,主要使用XPath技術。XPath使用路徑表達式來選取XML文檔中的節點或者節點集;這些路徑表達式與常規操作系統中文件系統路徑表達式非常相似。所述路徑可以是絕對路徑,也可以是相對路徑。路徑表達式可以具有謂詞(predicate),通配符和運算符。XPath還含有超過100個內建標準函數,這些函數用于字符串值、數值、日期和時間比較,節點處理、序列處理、邏輯值等等。
然而,現有的DOM解析技術仍然存在性能缺陷,主要表現在:XPath主要根據節點路徑及節點屬性值等條件字符串表達式,來解析定位XML,解析XPath過程中,主要也是通過遍歷節點比較元素名稱及元素值的字符串來判斷定位;因此,尤其當XML文檔處理比較多,文檔比較大,層次比較深及條件比較復雜時,其頻繁的解析XPath表達式及遍歷節點比較字符串會直接體現出解析定位性能慢的缺陷。
因此,如何加快對XML文件中節點的尋址(即定位),從而提高對XML文檔的解析效率,成為目前亟待解決的技術問題。
發明內容
本發明正是基于上述問題,提出了一種新的技術方案,可以在二維關系表向XML文件進行格式轉換時,通過位置標識來加快對節點的尋址操作,從而尤其當XML文檔的內容比較多、層次比較深及條件比較復雜時,有助于提高轉換效率。
有鑒于此,本發明提出了一種文檔格式轉換方法,包括:獲取與目標XML文件的格式相同的XML模板文件,以及與待處理的二維關系表的格式相同的標準二維關系表,將所述XML模板文件對應的DOM樹中的每個節點的元素信息記錄至配置表中,并將所述DOM樹中的每個節點與所述標準二維關系表中的參數之間的映射關系存儲至所述配置表中;為所述DOM樹中的至少一個節點生成對應的位置標識,并與對應的節點相關聯地存儲所述位置標識;根據所述配置表,將所述待處理的二維關系表中的參數填充至所述XML模板文件中,以生成所述目標XML文件,其中,根據所述位置標識對所述XML模板文件中對應的節點進行尋址。
在該技術方案中,不同于直接使用XPath技術對XML文件進行解析時采用的路徑信息,本發明通過單獨為節點生成位置標識,使得該節點可以被依照位置標識來尋得,避免采用路徑進行尋址時,對節點的反復遍歷,尤其是對于很多節點具有相同的元素名稱和甚至部分相同的屬性值的情況,能夠有效提升對節點的尋址速度,提高對XML的解析效率和對二維關系表的格式轉換效率。
在上述技術方案中,優選地,生成所述位置標識的過程包括:根據所述DOM樹中的任一節點與所述DOM樹中的其他節點之間的層級關系,以及所述任一節點與所屬層級內的其他節點之間的位置關系,生成所述位置標識,并將所述位置標識存儲至所述配置表中。
在該技術方案中,通過將XML文件解析為DOM樹結構,使得每個節點都能夠由層級關系和位置關系進行定位,從而相對于XPath中根據節點路徑和節點屬性值等條件字符串表達式的定位方式,無需對節點反復遍歷,能夠有效提高對節點的定位速度和對XML文件的解析效率。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北大醫療信息技術有限公司,未經北大醫療信息技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201310596651.7/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種用于電腦十字繡的網格布生產方法
- 下一篇:掛燙機加熱噴頭





