[發明專利]移置三類漢字信息字碼表實現字詞句的隨機編碼方法在審
| 申請號: | 201210536574.1 | 申請日: | 2012-12-13 |
| 公開(公告)號: | CN103049096A | 公開(公告)日: | 2013-04-17 |
| 發明(設計)人: | 陳玉龍 | 申請(專利權)人: | 劉陶 |
| 主分類號: | G06F3/023 | 分類號: | G06F3/023 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 610000 四川省成都市*** | 國省代碼: | 四川;51 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 移置 漢字 信息 字碼 實現 字詞 隨機 編碼 方法 | ||
技術領域
本發明涉及計算機中文信息處理領域,提出了一種新的系統信息結構和新的編碼規則以及實現字、詞、句隨機編碼的技術方案。?
背景技術
當今信息技術日新月異,唯獨漢字輸入技術三十年沒有根本性突破,癥結在哪里??
漢字是一類多信息(形、音、筆劃等)文字,選擇信息的多樣化是其輸入優勢,構字缺乏規律性又是其輸入劣勢。輸入法的出路就是揚長避短。對多信息文字來說,任何一類單信息編碼方案都是不可取的。當前普遍采用的碼表技術是一種單信息編碼技術,因而至今也擺脫不了難學難用的困境。中文輸入若要走出困境,不在創建更多的編碼方案,而是要創建一種適應漢字特點的編碼方法。最理想的輸入方法無疑是用戶自主編碼操作。也就是說,最好是一個因人而異、因字(或詞或句)而異、隨機應變、包羅萬象,又各取所需的綜合型漢字輸入系統,這樣的系統不僅讓人們充分利用自己熟悉的各類漢字信息,又能回避其中不熟悉的成分,從而面對不同知識層面的全體華人。這就是中文隨機編碼方法。?
本人二年前申請過一項專利技術“中文信息數字化處理方法和漢字隨機編碼方法”(申請號:201010274141.4)曾提出一種分列式特征碼列表結構,在系統中建立三類不同信息(部件、拼音、筆劃等)的分列表,雖然實現了字、詞、句隨機編碼操作。但是這種分列表,結構較松散和繁瑣,其中部件類信息的鍵位列表就有26個,拼音信息要建立23個聲母和35個韻母列表,如此多的列表會給實施和推廣這項技術帶來不便和困擾。它的優點是執行速度較快。?
發明內容
針對上述現有技術的不足,本發明提出一種集成式特征碼列表結構。同樣的三類漢字信息(部件、拼音、筆劃等),只需建立三個列表就可實現同類和不同類信息的字、詞、句隨機編碼操作,其結構緊湊、直觀,而且可直接移植當今通用的任何三類不同編碼方案中的字碼表(無需詞、句碼表),但這里的字碼表不是用作搜索編碼漢字,而是用作字、詞、句隨機編碼的數字化信息源。與集成式列表結構相配套的隨機處理技術還包括一套“隨機編碼規則”?和“信息比對編碼法”,構建字、詞、句隨機編碼的三項技術支柱。?
優選地,移置三類漢字信息字碼表實現字詞句的隨機編碼方法包括如下步驟:設置部件、拼音、筆畫三類字碼表于特征碼列表中作為系統信息源;設置字、詞、句隨機取碼規則作為隨機編碼的操作規范;采用“信息比對編碼法”作為隨機編碼實施方案,其中包括設置字、詞、句三個編碼緩沖區、字、詞、句編碼信息采樣和儲存方法、建立字詞句編碼特征數據及其字詞句編碼判別方法等。這是完整配套措施,缺一不可。?
優選地,字的隨機編碼方法,當輸入第一鍵時,先判斷輸入信息類型,然后選擇同類型的特征碼列表,將該列表中每個漢字特征單元的首鍵序與輸入信息比對,比對一致者,置字編碼緩沖區同一漢字的數據項D0位為“1”,比對不一致的漢字,保持D0=0;輸入第二鍵,若和第一鍵屬相同類型,則要和該類特征碼中每個漢字的第二鍵序比對,若和第一鍵為不同輸入類型,則要和異類特征碼的第一鍵序比對,比對結果置字編碼緩沖區同一漢字數據項(國標單元)的D1位為“1”,第三、四鍵與第二鍵相同,不過與特征碼比對的鍵序位和儲入字緩沖區的數據位不同;當輸入字結束鍵,去字緩沖區搜索每個字數據項中的儲入數據,在碼長內為全“1”的即為編碼字。?
優選地,詞編碼只與字的第一第二鍵序有關,所以每壓一鍵,輸入信息要同時與特征碼列表中的第一第二鍵序作比對。輸入第一鍵,根據輸入信息類型與其同類特征碼列表中每個漢字的首、次鍵序碼作比對,首鍵序比對一致,置詞編碼緩沖區同一漢字數據項(國標單元)的D0位為“1”,比對不一致則不變;次鍵序比對一致,置詞緩沖區同一漢字數據項的D1位為“1”,比對不一致則D1位不變;壓第二、三、四鍵,效法處理,不過置入詞緩沖區的是D2D3位、D4D5位、D6D7位;詞結束鍵后,逐條檢出詞庫中詞語,根據其詞長在詞緩沖區構建詞編碼判別單元,并與詞編碼特征數據作比對,詞編碼特征數據不僅與詞長有關,也與輸入信息類型的異同有關,符合詞編碼特征數據的詞屬編碼詞。?
優選地,句編碼只與字的第一鍵序有關;輸入第一鍵,壓鍵信息與其同類特征碼列表中每個漢字的第一鍵序碼作比對,比對一致,置句編碼緩沖區同一漢字數據項(國標單元)的D0位為“1”,比對不一致則不變;輸入第二鍵,根據輸入信息類型與其同類特征碼列表中每個漢字的第一鍵序碼作比對,比對一致者儲入句編碼緩沖區同一漢字數據項的D1位,重復上述步驟輸入第三、四、五直至末鍵,去句庫檢出與壓鍵數相關句長句子,依次搜索句中每個字在句緩沖區中的相應數據位是全“1”的句子屬編碼句。?
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于劉陶,未經劉陶許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201210536574.1/2.html,轉載請聲明來源鉆瓜專利網。
- 信息記錄介質、信息記錄方法、信息記錄設備、信息再現方法和信息再現設備
- 信息記錄裝置、信息記錄方法、信息記錄介質、信息復制裝置和信息復制方法
- 信息記錄裝置、信息再現裝置、信息記錄方法、信息再現方法、信息記錄程序、信息再現程序、以及信息記錄介質
- 信息記錄裝置、信息再現裝置、信息記錄方法、信息再現方法、信息記錄程序、信息再現程序、以及信息記錄介質
- 信息記錄設備、信息重放設備、信息記錄方法、信息重放方法、以及信息記錄介質
- 信息存儲介質、信息記錄方法、信息重放方法、信息記錄設備、以及信息重放設備
- 信息存儲介質、信息記錄方法、信息回放方法、信息記錄設備和信息回放設備
- 信息記錄介質、信息記錄方法、信息記錄裝置、信息再現方法和信息再現裝置
- 信息終端,信息終端的信息呈現方法和信息呈現程序
- 信息創建、信息發送方法及信息創建、信息發送裝置





