[發明專利]計算機資源定位的漢字繁簡體轉換方法無效
| 申請號: | 01119920.2 | 申請日: | 2001-06-29 |
| 公開(公告)號: | CN1393803A | 公開(公告)日: | 2003-01-29 |
| 發明(設計)人: | 李曉東;許乃文;呂愛琴;孫國念;王艷峰;鄧翔;張文輝;毛偉 | 申請(專利權)人: | 中國互聯網絡信息中心;財團法人臺灣網路資訊中心 |
| 主分類號: | G06F17/28 | 分類號: | G06F17/28 |
| 代理公司: | 中科專利商標代理有限責任公司 | 代理人: | 朱進桂 |
| 地址: | 100080*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 計算機 資源 定位 漢字 繁簡 轉換 方法 | ||
本發明涉及計算機漢字處理中的簡體字向繁體字以及繁體字向簡體字轉換的方法,特別是計算機網絡的域名注冊和解析過程中簡體字向繁體字以及繁體字向簡體字轉換的方法。
目前,在很多機構和組織中要對漢字進行簡繁體字的互換工作。在簡繁體字互換的過程中主要存在以下三種情況:(1)一個簡體字對應一個繁體字;(2)一個簡體字對應多個繁體字;(3)一個繁體字對應多個簡體字。多數簡繁體字的互換是基于語義完成的。由于簡繁體字的互換并不是簡單的一對一的關系,在處理過程中就要根據文字的上下文關系及語義對多種可能的對應關系進行比較,這就使得計算機要處理大量數據,完成繁簡體字轉換的資源消耗和工作量會隨著轉換的成功率的提高而變得非常大,而且這種消耗對于某些相關的計算機的特定應用來說是難以實現的。
在中國的兩岸四地對漢字的使用存在著一定的差異。中國大陸使用的是簡體中文(編碼標準是GB18030),而臺灣、香港、澳門使用的是繁體中文(編碼標準為BIG5)。但是對普通用戶而言,無法嚴格地要求用戶區分繁簡體字的使用。即使是在中國大陸,由于歷史遺留原因,人們仍然在某些場合使用繁體字。例如,人們在書寫店名、招牌、書法的時候多用繁體字,但是在正式的文書中則使用簡體字。很多中國人兩種書寫方式都看得懂,而且這種使用狀態可能還要持續很長時間。
隨著互連網技術對人們生活的影響日益增大,越來越多的人上網沖浪,在網上查找感興趣的信息。但是,目前互連網域名的注冊方式是采用對輸入的字符本身進行注冊和解析,即僅注冊和解析輸入的單一字符。隨著中文域名注冊服務的開展,越來越多的企業、機構、或個人等正在積極、踴躍地注冊自己感興趣的域名。但由于不同地區對簡繁體漢字的使用差異,以及某些人或機構對域名的惡意搶注,造成某些企業、機構、或個人只注冊了簡體或繁體字的中文域名,而未注冊同一名稱的繁體或簡體字的中文域名,或是注冊了簡體或繁體字的中文域名,而同一名稱的繁體或簡體字的中文域名卻被他人或機構惡意搶注,給企業或機構造成商業損失和不良影響。人們在上網時,可能存在著想用簡體字或繁體字輸入表示同一域名的漢字,卻出現不同內容的情況,給使用簡體或繁體漢字的不同地區的人們在網上檢索信息帶來不便。
另外,對于計算機資源定位而言,如果采用基于分詞和語義分析的繁簡體漢字轉換方法來實現繁簡體字計算機資源的統一定位,雖然也可以實現部分程度的功能,但是有兩個缺點:
第一點,由于計算機資源描述的方式僅僅是為了便于記憶,是一種標識符,本身無意義,在沒有建立足夠龐大的詞庫和擁有足夠的智能之前(現有技術條件下的人工智能是無法達到的),基于分詞和語義分析的繁簡體字轉換方法就無法正確的分詞并進行語義分析處理,從而就更無法實現正確、合理的資源定位;
第二點,計算機資源的定位是一種要求簡捷高效的網絡定位服務,基于分詞和語義分析的繁簡轉換方法由于其實現原理本身的問題而根本無法做到簡捷高效。
因此,必須采用合理的方法來實現計算機資源定位中的漢字繁簡轉換功能。
本發明的目的是提供一種在計算機資源標識注冊和解析時能夠有效地進行簡體向繁體漢字以及繁體向簡體漢字互換的方法。在使用計算機資源對中文進行定位的時候,能完成高效的、簡捷的、合理的以及無模糊的繁簡體及簡繁體漢字的轉換,定位到相應的計算機資源。
根據本發明用于計算機資源標識注冊和解析的簡繁體漢字的相互轉換方法,其特征在于包括步驟:
a)用戶利用輸入裝置輸入中文計算機資源定位標識;
b)用戶方發出相應的定位請求,計算機系統將用戶的輸入內容轉換為相應的內碼表示形式;
c)應用層程序獲取用戶的資源定位請求,對請求中的標識編碼進行處理,過濾掉非法字符,對一一對應的繁簡體字符作映射處理,將標準的資源定位請求發向服務器處理程序;
d)服務方程序,通過相應的漢字簡繁體轉換處理后,查詢用戶所需的資源定位信息,并將該資源定位信息提供給用戶的應用層程序;
e)根據應用層程序處理返回的資源定位信息,如果沒有定位信息,則報錯;如果有定位信息,則定位相應的網絡資源位置,并獲得相應的計算機資源。
另外,服務器中的服務方程序所進行的漢字簡繁體轉換進一步包括:如果計算機資源定位請求是簡體字,直接處理此請求,返回給請求發出方相應的結果;如果計算機資源定位請求是繁體字,在繁體字與簡體字一一對應的情況下,作一對一等效處理;在多個繁體字對應一個簡體字的情況下,將繁體字等效為簡體字;一個繁體字對應多個簡體字的情況下,根據服務方的配置情況,將此繁體字等效為簡體字。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國互聯網絡信息中心;財團法人臺灣網路資訊中心,未經中國互聯網絡信息中心;財團法人臺灣網路資訊中心許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/01119920.2/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:可動磁鐵型計量儀表及使用該可動磁鐵型計量儀表的計量裝置
- 下一篇:光隔離器





