[發明專利]不同語種XML文檔的轉換方法及裝置無效
| 申請號: | 200910244003.9 | 申請日: | 2009-12-24 |
| 公開(公告)號: | CN101866331A | 公開(公告)日: | 2010-10-20 |
| 發明(設計)人: | 李寧;侯霞;吳志剛;方春燕 | 申請(專利權)人: | 北京信息科技大學;工業和信息化部電子工業標準化研究所 |
| 主分類號: | G06F17/22 | 分類號: | G06F17/22;G06F17/30 |
| 代理公司: | 北京同立鈞成知識產權代理有限公司 11205 | 代理人: | 劉芳 |
| 地址: | 100101*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 不同 語種 xml 文檔 轉換 方法 裝置 | ||
技術領域
本發明實施例涉及計算機信息交換領域,尤其涉及一種不同語種可擴展標記語言(eXtensible?Markup?Language,簡稱XML)文檔的轉換方法及裝置。
背景技術
信息的國際化交換和本地化表示是一種信息處理技術發展中的長期的需求。信息的國際化交換和本地化表示技術已從早期的字符集編碼轉換發展到更高的信息結構和語義轉換的層次。支持結構化信息表示的XML技術目前已經成為全球信息共享的基礎之一。如何使XML的數據表示同時滿足國際化和本地化需求是亟待解決的、意義深遠的問題。
在以往XML的數據表示國際化和本地化技術發展中,人們主要專注于通過良好的XML構造習慣使之便于進行多語種轉換,其重點是元素內容的翻譯,而元素名稱和屬性名稱的轉換一直是使用中被極力回避的問題。業界目前還沒有形成一種完全并且通用的方法來實現XML最需要的元素名稱和屬性名稱的多語種轉換。
一類方法是通過定義和使用詞匯表的方式提供多語種XML文檔轉換。例如語料編碼標準(Corpus?Encoding?Standard,簡稱CES)、通用語言環境數據倉庫(Common?Locale?Data?Repository,簡稱CLDR)等。其實質是通過定制的方法創建置標詞匯表(或庫),用于源語言和目標語言之間的翻譯和轉換。此類方法存在的問題是:需要在集中式的管理機制下預先創建轉換詞匯表以支持有限語種間的翻譯;而且由于不同語種語義的不同,經過多次翻譯后很難保持原XML元素和屬性名稱所表達的精確含義。
如果采用這類方法,一個制定和發布某種XML文檔類型的機構發布的一個語種的文檔大綱(Schema)版本和XML實例文檔被多次翻譯之后其中的元素和屬性名稱會偏離原始的含義。在這種情況下,如果要對日后來自任何語種使用人群的同類型文檔進行處理,就需要很大的維護工作量。這種情況使得多語種的XML數據的處理和共享非常困難,經過翻譯后XML文檔不能夠保持XML元素和屬性名稱所表達含義的精確性,也使XML的應用受到多語言的障礙,不具有通用性、靈活性和實用性。
中國的國家標準“標文通”(Unified?Office?document?Format,簡稱UOF)1.0在此方面做了一些努力,提供了一種多語種XML文檔轉換的方法。該方法中,對進行語種轉換的元素,在實例中設置不可改變的、唯一的標識符屬性和屬性次序屬性;當需要進行XML實例文檔轉換時,依據事先設計的轉換規則,將待轉換的語種的XML實例文檔轉換為目標語種的XML實例文檔。該方法的問題在于:通過添加屬性來表達標識符和屬性次序信息的方法,在一定程度上會帶來XML文檔處理數據量的增加,同時將簡單元素變為復制元素也會增加處理的復雜度。
發明內容
本發明實施例提供一種不同語種XML文檔的轉換方法及裝置,用以解決現有技術中一個語種的XML文檔被多次翻譯之后,翻譯后的語種的XML文檔中的元素和屬性名稱再次轉換成原始語種的XML文檔時,其中的元素和屬性名稱偏離原始含義的問題,以及現有技術中XML文檔轉換會帶來XML文檔處理數據量增加和處理復雜度提高的問題。通過本發明可實現不同語種XML文檔的轉換,使得一個語種的XML文檔被多次翻譯之后,翻譯后的語種的XML文檔中的元素和屬性名稱再次轉換成原始語種的XML文檔時,其中的元素和屬性名稱不偏離原始含義,并且不會導致XML文檔數據量的顯著增加。
為了解決上述問題,本發明實施例提供了一種不同語種XML文檔的轉換方法,包括:
步驟1、判斷待轉換的語種的XML實例文檔中是否存在需要轉換的元素或屬性命名;如果存在,執行步驟2;如果不存在,執行步驟3;
步驟2、提取待轉換的語種的XML實例文檔中需要轉換的元素或屬性命名中的標識符的值,將所述待轉換的語種的XML實例文檔中的需要轉換的元素或屬性命名轉換成具有相同標識符的值的待生成的目標語種XML實例文檔的元素或屬性命名,然后執行步驟1;所述元素或屬性命名包括所述元素或屬性名稱和用于在預先定義的命名空間中唯一標識所述名稱的標識符;
步驟3、結束轉換。
其中,步驟2可以包括:
步驟21、提取所述待轉換的語種的XML實例文檔中需要轉換的元素或屬性命名中的標識符的值;
步驟22、判斷目標語種的大綱中是否存在標識符的值與所述步驟21中提取出的標識符的值相同的元素或屬性命名,如果存在,執行步驟23;如果不存在,執行步驟24;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京信息科技大學;工業和信息化部電子工業標準化研究所,未經北京信息科技大學;工業和信息化部電子工業標準化研究所許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/200910244003.9/2.html,轉載請聲明來源鉆瓜專利網。





