[發明專利]字庫的存儲與訪問方法有效
| 申請號: | 201210088042.6 | 申請日: | 2012-03-29 |
| 公開(公告)號: | CN102662926A | 公開(公告)日: | 2012-09-12 |
| 發明(設計)人: | 黃克儉 | 申請(專利權)人: | 常州華文文字技術有限公司 |
| 主分類號: | G06F17/22 | 分類號: | G06F17/22;G06F17/30 |
| 代理公司: | 北京泛華偉業知識產權代理有限公司 11280 | 代理人: | 王勇 |
| 地址: | 213168 江蘇省*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 字庫 存儲 訪問 方法 | ||
技術領域
本發明涉及文字處理領域,尤其涉及字庫的存儲和訪問方法。
背景技術
從計算機誕生以來,文字處理就是計算機所要完成的主要任務之一,文字顯示則是文字處理的一個重要方面。計算機在做文字顯示的過程中,需要根據用戶的某種輸入方法轉換得到的文字編碼從存儲字形數據的字庫中提取相應文字的字形數據,進而由計算機根據這些字形數據在顯示終端或輸出設備上描述或輸出文字的字型,從而實現文字的顯示或輸出。從上面的說明可以看出,文字顯示或輸出主要涉及兩方面的內容,一是文字編碼,二是字形描述數據。文字編碼是溝通用戶與計算機之間的一個橋梁,計算機只有通過文字編碼才能“讀懂”用戶所輸入的信息,處理用戶所需要的文字。在現實生活中,世界各地有成百種不同類型的語言文字,應用到計算機上的常用語言文字也大約有三十多種。針對不同種類文字的文字編碼不具有統一性的問題,Unicode協會提出了名稱為Unicode的字符編碼標準。該字符編碼標準為世界上各種語言文字中的每個字符設定了統一并且唯一的二進制編碼,以滿足跨語言、跨平臺進行文本交換、處理的要求。Unicode后來又與國際標準化組織所提出的ISO?10646相合并,基本解決了多語言文字編碼統一性的問題。針對字形數據,目前常見實現方式是在計算機中保存多個不同語言文字的字庫。字庫就是對文字及其它字符的數字化,存儲了每個文字字形的集合,定義了文字輸出的形狀等。如果在一個文檔中調用多種文字字符,需要根據所用的語言種類從相應種類文字的字庫中調用字符。如果所在計算機上沒有安裝相應種類文字的字庫,則有可能無法顯示該文字或者可能會顯示亂碼。
而且隨著互聯網和嵌入式技術的發展,人們可以隨時隨地利用身邊的各種計算設備(如手機、掌上電腦,智能家電等)來訪問網絡上的各種資源,或者使用多種語言文字與網絡上的其他用戶進行交互,或者這些設備之間進行交互。在不同的語言環境及其所使用的不同設備環境中進行文字處理面臨著新的挑戰,這是由于各種移動設備以及嵌入式設備的資源有限,并且使用各種不同的操作系統,管理和維護用戶所使用的所有終端設備上的所有字庫文件,并確保無縫地跨平臺的信息交互是一項非常艱巨的任務。例如,在某個終端上如果沒有所需文字所對應的字庫,則無法正常顯示該文字。此外,在文字處理時,使用多個獨立的字庫文件既占用了大量的存儲空間,又增加了字庫的檢索時間,這對于資源有限的嵌入式應用平臺有很多不利的影響。
鑒于Unicode標準已經對各種文字的文字編碼做了統一分配,因此本領域技術人員想到將Unicode標準中的文字編碼與用于描述文字形狀的字形數據(字形數據中描述文字形狀的方式有多種,如點陣式、向量式、曲線式等)相結合,從而得到一個包含多語言所有文字的所有字符的字庫來適應新的應用環境中。這種字庫也可被稱為多語言字庫,例如美國微軟公司委托蒙那公司制作的Monotype?Arial。該多語言字庫為每個Unicode編碼安排了對應的字形數據。
但其中也存在一些問題,比如Unicode2.0中對常用漢字字符集定義時,沒有為某些漢字字形在不同國家或地區使用的具有微小差異的同一文字分配不同的編碼,例如,如圖1所示,漢字“牙”在Unicode標準中用一個編碼“7259”表示,但實際上,中文簡體、中文繁體、日文、韓文中的“牙”字的字形各不相同。因此,在現有的多語言字庫中,一個Unicode碼只對應一種字形數據,對于前述“牙”字這種情況就只能從四種字形的字形數據中缺省選擇一種放入所述多語言字庫中。但在中文文本中出現日文的“牙”字顯然不能滿足用戶的要求。而如果在多語言字庫中,允許一個Unicode碼對應一種以上的字形數據,又會遇到容易混淆的問題。例如,當用戶輸入7259編碼后,如果沒有其他的輔助信息,計算機無法知道是要調用中文簡體、中文繁體、日文、韓文中的哪一個“牙”字的字形數據。另外,由于已有的不同文字的字形數據通常由不同的廠商提供,因此在風格、字體、大小、字間距等與字型有關的信息上存在較大的差異。當在同一文本中出現不同種類文字的字符時,這種差異會影響文本的總體美觀。而且,不同廠商所提供的字形數據的坐標通常也不相同,這使得不同種類文字字符之間存在無法對齊的現象,也影響了文本的美觀。
發明內容
本發明的目的在于克服上述現有技術的缺陷,提供一種字庫的存儲方法,不僅可以節省字庫本身所占的存儲空間,而且可以靈活地對字庫進行存儲和訪問。
本發明的目的是通過以下技術方案實現的:
一方面,本發明提供了一種字庫的存儲方法,所述字庫包括字形描述符和字形描述數據,所述方法包括:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于常州華文文字技術有限公司,未經常州華文文字技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201210088042.6/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種單面多片式的玻璃薄化設備及方法
- 下一篇:一種加速度動作識別系統及其方法





