[發明專利]冷僻漢字的筆順子字檢索法有效
| 申請號: | 201110422325.5 | 申請日: | 2011-12-16 |
| 公開(公告)號: | CN103164466A | 公開(公告)日: | 2013-06-19 |
| 發明(設計)人: | 李瑞民;杜根遠;邱穎豫 | 申請(專利權)人: | 李瑞民;杜根遠;邱穎豫 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30;G06F3/023 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 200092 *** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 冷僻 漢字 筆順 檢索 | ||
技術領域
本發明涉及一種漢字檢索方法,具體的說是一種冷僻漢字的筆順子字檢索法,該方法同樣適用普通漢字檢索。
背景技術
一、漢字檢索和輸入的時代背景和技術背景
我國歷史悠久、文字發展時間漫長,所以文字存在數量巨大、字形多樣、一字多音、簡體與繁體共存、常用字與冷僻字共存等現象。每個人由于文化水平、工作領域不相同,而導致很多文字在遇到時不知道發音、不知道偏旁、當前輸入法不識別該字等問題。
關于漢字檢索和輸入的現狀是:漢字的顯示問題初見解決,但檢索和輸入仍存在較多問題。近年來,計算機的處理已普及到了漢字處理的各個領域,縱觀漢字漢庫的發展史,我們發現可以分為兩個階段:最早大陸的GB2312(收錄6763個常用簡體漢字)和港澳臺的BIG5碼(收錄13060個常用繁體漢字)同時出現,只解決了常見漢字的顯示、和輸入問題,但仍存在冷僻漢字無法顯示、二者的互不兼容、輸入法多樣等問題;第二階段是Unicode漢字,該字庫收超過10萬多國文字,可以顯示絕大多數漢字,相比第一階段,也只是解決了冷僻字的顯示、中國大陸、港澳臺、海外漢字之間的兼容問題,但隨之而來未能解決的是其中漢字的輸入。縱觀該字庫的特點,對于冷僻字的輸入,如果照搬現有的輸入法,存在如下問題:1、以漢字發音為主的拼音輸入法將全面失效。作為中國人,都以能認識中國字為榮,但據不完全統計,漢字數量本身就近十萬,即使這樣,隨著新的古籍的發現,仍有增加的可能,除非是漢文字專家,否則幾乎沒有幾個人能認識半數以上,更談不上某字的發音了,例如“籲、灪、龖”的發音。因此拼音輸入法對冷僻字無法繼續使用。2、以拆字為主的字型輸入法將部分無效。當引入冷僻字后,這些輸入法中存在的問題主要是會出現大量重碼。以五筆字型為例,其輸入法最大的優勢就是重碼少,可以實現盲打,但當隨著收錄編碼漢字的增多,重碼大大增加,使其優勢盡失。
二、本發明的背景知識
1、筆順:相對于發音和拆字,筆順輸入法就簡單的多,只要知道筆順就可以寫字,而不必一定認識所檢索和輸入的字。漢字中有“五筆劃”劃分法,即將漢字的筆劃劃分為“橫豎撇捺折”五種,其中:
在本發明中,為了便于對“橫豎撇捺折”進行輸入,約定數字1~5與之對應等價。即橫用1代替,豎用2代替,撇用3代替,捺用4代替,折用5代替。
當然,筆順的缺點是:隨著碼長的增加,可以大大減少重碼,但缺點就是碼長太長,且不定長。
2、漢字的組成
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于李瑞民;杜根遠;邱穎豫,未經李瑞民;杜根遠;邱穎豫許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201110422325.5/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種自動裝箱機構
- 下一篇:一種用于鋁棒的切割機構





