[發明專利]一種漢字資料庫的檢索系統及配置方法無效
| 申請號: | 201010217213.1 | 申請日: | 2010-07-05 |
| 公開(公告)號: | CN102314446A | 公開(公告)日: | 2012-01-11 |
| 發明(設計)人: | 丘鎮華 | 申請(專利權)人: | 丘鎮華 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 北京科龍寰宇知識產權代理有限責任公司 11139 | 代理人: | 孫皓晨 |
| 地址: | 中國臺*** | 國省代碼: | 中國臺灣;71 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 漢字 資料庫 檢索系統 配置 方法 | ||
技術領域
本發明提供關于資料庫的檢索與配置技術,尤指一種能利用漢字外觀特性來使漢字資料庫更容易為人所查詢、檢索的資料庫檢索系統及配置方法。
背景技術
世界上最古老的三大文字系統的一包括漢字、古埃及的圣書字、蘇美爾人的楔形文字,其中漢字為唯一沿用至今的文字。中國文化源遠流傳,現代漢字的中文體大致分成簡體中文與繁體中文兩個體系。前者主要用于中國大陸以及新加坡、馬來西亞等東南亞國家,而后者主要用于中國香港、中國澳門以及中國臺灣,一般來講,簡繁兩個體系的使用者都能在短期內適應并能看懂另一體系的文字,并無太大的溝通障礙。日本和韓國則是另行各自制定了官方的漢字使用規范,而漢字早期也在越南、朝鮮和蒙古流通。
漢字資料庫或字典的編列與查詢方式,不同于一般英語字典能直接以字母編碼進行邏輯排序查詢,一般而言于漢字資料庫或字典查詢單字的方式分為部首查詢、筆劃查詢、拼音查詢、難字查詢、四角號碼...等等,然而其中有關部首查詢、拼音查詢等查詢方式,必須是在已了解該字的部首分類、讀音的情況下才有辦法于資料庫或字典中找尋到該字的對應資料,而筆劃查詢雖然可透過計算字形筆畫數的手段于漢字資料庫或字典中進行配對查詢,然而中國文化博大精深,漢字數量約十萬字,若以筆畫數為其分類,就會花費大量的時間在人工逐字比對之上,其查字速度相當沒有效率。
近年來中國大陸與中國臺灣之間的兩岸交流逐漸頻繁,簡體與繁體已在民間廣泛交流,簡體與繁體中文的部首、筆畫差異更為明顯;再者,漢字的使用除了繁體與簡體的差別外,也有標準楷書、宋體、俗寫、誤寫等問題存在,導致許多人在進行漢字資料庫或字典查詢時耗時費力,甚至查詢不到該字。
例如勛字的寫法包含簡體字「勛」、繁體字「勳」、俗寫字「勲」、古字「勛」等寫法,而當不懂漢字的國際人士看到這些字要了解勛字的含意時,還必須先分辨是要查簡體字的字典還是繁體字的字典,再者于分辨出簡體字、繁體字之后,還必須要先猜測其部首或拼音,因此造成查詢上的困難。
由于漢字不同于英文字由字母直接排列組合而成,而可由左至右依循字母排列方式進行直接排序,因此造成以往漢字資料庫或字典于排序時,必須制訂較復雜的人為規則與分類訓練,才有辦法讓查詢者依循漢字部首或其他復雜的規則來進行查詢,發明人針對現今漢字簡體與繁體并存的問題以及因應時代所產生的通用、俗寫、誤寫等問題進行探討,以對漢字資料庫的檢索與配置技術進行全面性的改善。
再者,即便是使用漢字為母語的中國人,也經常發生不易辨識部首或完全不知拼音的情形,以漢字中的繁體字為例,有些字的部首又稱為暗部首,如:「囊、嘗」為「口」部、「夜」為「夕」部、「威」為「女」部...等等,而繁體字的「月」部、「肉」部往往又難以分辨,如:「朋、服、望、朔、朗」為「月」部、「胎、胍、能、脅、腎、臘、膺」為「肉」部,甚至有些繁體字很難判斷其所屬部首,例如:「前」為「刀」部,「幸」為「干」部、「垂」為「土」部。
隨著中國文化的發揚、舉辦各種世界級的主流活動、中國制造的產品流通于全球,漢字遍及世界已為一項不可輕忽的事實,外國人甚至將漢字視為一種藝術、圖騰予以收藏欣賞,漢字的所以對外國人來說是一種藝術、學習門檻較高;其最主要的原因就在于,并非以漢字為母語的外國人、漢字初學者、對漢字部首、拼音不熟悉的使用者,在查詢漢字時更是困難重重。倘若能讓外國人從漢字的基礎形貌,直接獲得直覺、簡單的檢索依據,即可讓漢字的推廣更為容易。
發明人于早先提出發明專利申請在案,并獲準發明專利的「電腦中文數位化輸入方法及簡便靈巧鍵盤」,其申請號為CN91111955.8、授權公告號為CN1027196、授權公告日為1994年12月28日,其主要利漢字可能的十個首末筆劃對應于鍵盤上的1、2、3、4、5、6、7、8、9、0十個鍵;將漢字依其字形分類;在輸入一個漢字時首先判斷該漢字所屬的字形類別,再根據其所屬字形類別將該漢字分解為「元」,并且每個漢字最多分解為三元,再將各元的首末筆依序由鍵盤輸入。
有鑒于稍早的發明,具有可供使用者不需花費太多時間學習,以及具有可直接憑直覺手段來拆字、認字的功效,據此,發明人創思運用先前技術手段加以改良與變化,以運用于漢字資料庫的檢索系統及配置方法以符合現今簡體與繁體并存的問題,并且還能擴大應用于漢字的通用、俗寫、誤寫等情形,以使漢字的檢索更加簡單、方便與完整。
發明內容
本發明的主要目的,在提供一種漢字資料庫的檢索系統及配置方法,以使漢字資料庫的查詢更為簡易與容易上手。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于丘鎮華,未經丘鎮華許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201010217213.1/2.html,轉載請聲明來源鉆瓜專利網。





