[發(fā)明專利]中文信息數(shù)字化處理方法和漢字隨機編碼方法無效
| 申請?zhí)枺?/td> | 201010274141.4 | 申請日: | 2010-09-07 |
| 公開(公告)號: | CN101930300A | 公開(公告)日: | 2010-12-29 |
| 發(fā)明(設計)人: | 陳玉龍 | 申請(專利權(quán))人: | 劉陶 |
| 主分類號: | G06F3/023 | 分類號: | G06F3/023 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 四川省成都市金牛區(qū)營*** | 國省代碼: | 四川;51 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 中文 信息 數(shù)字化 處理 方法 漢字 隨機 編碼 | ||
技術(shù)領(lǐng)域
本發(fā)明涉及一種計算機中文信息處理領(lǐng)域,特別涉及一種中文信息數(shù)字化處理方法以及采用這種數(shù)字化處理方法的一種漢字隨機編碼方法。?
背景技術(shù)
在現(xiàn)有的中文信息處理領(lǐng)域中,以字形編碼為例,碼表結(jié)構(gòu)設計者為了在標準鍵盤上實現(xiàn)字、詞輸入,一般都將200多個部件信息來分解一、二級國標漢字(GB2312),然后把這200多個部件信息直接地定位在26個字符鍵上,于是就把拆分漢字得到的部件碼變成可操作的鍵盤碼(字碼表)。并另行編制一套詞碼表(或用編碼生成器協(xié)助生成字、詞碼表),一并放入WINDOWS中文操作系統(tǒng)進行字、詞編碼操作。碼表結(jié)構(gòu)雖然解決了字、詞的輸入,由于分解后的漢字信息沒有經(jīng)過數(shù)字化處理,電腦程序無法操作,不僅每一個編碼方案都必須編制一套字、詞碼表,而且只能實現(xiàn)單一類的編碼操作(單一信息、單一序碼、單一碼長),浪費了大量人力和財力,也給編碼設計者和操作者帶來許多不便。?
發(fā)明內(nèi)容
針對上述現(xiàn)有技術(shù)的不足,本發(fā)明要解決的技術(shù)問題是提供一種可使中文信息進行程序化控制和處理的中文信息數(shù)字化處理方法,以便實現(xiàn)字和詞的隨機編碼輸入操作。?
為解決上述技術(shù)問題,本發(fā)明采用如下技術(shù)方案:?
一種中文信息數(shù)字化處理方法,將一、二級國標漢字按規(guī)范化信息標準進行拆分,拆分后的漢字信息進行特征碼信息列表,列表中的每個漢字特征碼包括漢字國標碼(GB碼)和控制碼二部分,國標碼是漢字代碼,控制碼則標記列表信息在該漢字拆分中的序碼。集合部件、聲韻母、筆劃的全部特征碼原始信息列表(YG表)作為漢字隨機編碼設計的信息源。?
優(yōu)選的,一、二級國標漢字的分解規(guī)范可以為“漢字部件規(guī)范”、“漢字筆畫規(guī)范”或“漢字拼音方案”三種。?
本發(fā)明還公開了一種采用上述中文信息數(shù)字化處理方法進行漢字隨機編碼的方法,其采用如下技術(shù)方案:?
a)首先將一、二級國標漢字按“漢字部件規(guī)范”、“漢字筆畫規(guī)范”和“漢字拼音方?案”進行拆分,拆分信息進行包括漢字國標碼和控制碼二部分的特征碼信息列表;?
b)建立漢字特征碼原始信息列表;?
c)對數(shù)字化的原始信息進行鍵位設計;?
d)將原始信息列表轉(zhuǎn)化為數(shù)字化的鍵位信息列表;?
e)設立字、詞編碼緩沖區(qū);?
f)儲存鍵入信息于字、詞編碼緩沖區(qū);?
g)字(或詞)結(jié)束鍵后,根據(jù)字(或詞)編碼特性在字(或詞)緩沖區(qū)中采集編碼信息;?
h)根據(jù)字(或詞)的編碼特性(特征數(shù)據(jù))判別該字(或詞)是否符合編碼條件,檢出編碼字(或詞),隨機編碼處理結(jié)束。?
優(yōu)選的,在一、二級國標漢字按“漢字拼音方案”拆分的漢語拼音信息中的聲母(21個)列表,其控制碼數(shù)據(jù)均為″01″,韻母(35個)控制碼數(shù)據(jù)均為″02″。?
優(yōu)選的,在一、二級國標漢字按“漢字筆畫規(guī)范”拆分的漢字筆劃一般采用″橫、豎、撇、點(捺),鉤″五個筆劃,用數(shù)字鍵1~5作代碼,也可以按雙筆劃組合(5×5=25組)虛擬地排列于字符鍵上,按數(shù)字鍵操作,按字符鍵列表。?
優(yōu)選的,所述部件列表中控制碼的標記信息,包括首部件標記、次部件標記、第三部件標記、末部件標記和尾部件標記,其中末部件是特指四個或四個以上部件漢字的最后一個部件;尾部件是泛指包括成字部件、雙部件、三部件及多部件在內(nèi)的所有漢字的最后一個部件。?
進一步的,原始信息列表轉(zhuǎn)化為數(shù)字化的鍵位信息列表采用四碼長鍵序(四碼長鍵序可同時兼容于三碼長和二碼長編碼操作),在四碼長的鍵序中,第一次出現(xiàn)的部件被看作首部件,其后依次為第二部件、第三部件和末部件;同樣,四鍵中首次出現(xiàn)的拼音信息視作聲母,其后為韻母;四鍵中出現(xiàn)的筆劃信息依次為第一二筆、第三四筆和第五末筆。?
優(yōu)選的,所述隨機編碼實施例中,不論字或詞編碼都可隨機變換輸入信息類型而無需切換。?
優(yōu)選的,所述隨機編碼實施例中,對于字編碼,不論是輸入同類信息還是異類信息,可隨機變換碼長而無需切換。?
優(yōu)選的,所述隨機編碼實施例中,包括建立字、詞編碼緩沖區(qū),其容量包含整個字庫(GB2312)。其作用為:輸入信息分別儲存于字和詞編碼緩沖區(qū);從字(詞)庫采集字(詞)?的編碼信息并去編碼緩沖區(qū)判別字(詞)編碼條件,最終獲得編碼字(或詞)。?
優(yōu)選的,所述字、詞編碼緩沖區(qū)每個漢字的數(shù)據(jù)位在輸入字、詞信息前要清零。?
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于劉陶,未經(jīng)劉陶許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201010274141.4/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06F 電數(shù)字數(shù)據(jù)處理
G06F3-00 用于將所要處理的數(shù)據(jù)轉(zhuǎn)變成為計算機能夠處理的形式的輸入裝置;用于將數(shù)據(jù)從處理機傳送到輸出設備的輸出裝置,例如,接口裝置
G06F3-01 .用于用戶和計算機之間交互的輸入裝置或輸入和輸出組合裝置
G06F3-05 .在規(guī)定的時間間隔上,利用模擬量取樣的數(shù)字輸入
G06F3-06 .來自記錄載體的數(shù)字輸入,或者到記錄載體上去的數(shù)字輸出
G06F3-09 .到打字機上去的數(shù)字輸出
G06F3-12 .到打印裝置上去的數(shù)字輸出
- 信息記錄介質(zhì)、信息記錄方法、信息記錄設備、信息再現(xiàn)方法和信息再現(xiàn)設備
- 信息記錄裝置、信息記錄方法、信息記錄介質(zhì)、信息復制裝置和信息復制方法
- 信息記錄裝置、信息再現(xiàn)裝置、信息記錄方法、信息再現(xiàn)方法、信息記錄程序、信息再現(xiàn)程序、以及信息記錄介質(zhì)
- 信息記錄裝置、信息再現(xiàn)裝置、信息記錄方法、信息再現(xiàn)方法、信息記錄程序、信息再現(xiàn)程序、以及信息記錄介質(zhì)
- 信息記錄設備、信息重放設備、信息記錄方法、信息重放方法、以及信息記錄介質(zhì)
- 信息存儲介質(zhì)、信息記錄方法、信息重放方法、信息記錄設備、以及信息重放設備
- 信息存儲介質(zhì)、信息記錄方法、信息回放方法、信息記錄設備和信息回放設備
- 信息記錄介質(zhì)、信息記錄方法、信息記錄裝置、信息再現(xiàn)方法和信息再現(xiàn)裝置
- 信息終端,信息終端的信息呈現(xiàn)方法和信息呈現(xiàn)程序
- 信息創(chuàng)建、信息發(fā)送方法及信息創(chuàng)建、信息發(fā)送裝置





