[發(fā)明專利]中文信息數(shù)字化處理方法和漢字隨機(jī)編碼方法無效
| 申請(qǐng)?zhí)枺?/td> | 201010274141.4 | 申請(qǐng)日: | 2010-09-07 |
| 公開(公告)號(hào): | CN101930300A | 公開(公告)日: | 2010-12-29 |
| 發(fā)明(設(shè)計(jì))人: | 陳玉龍 | 申請(qǐng)(專利權(quán))人: | 劉陶 |
| 主分類號(hào): | G06F3/023 | 分類號(hào): | G06F3/023 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 四川省成都市金牛區(qū)營*** | 國省代碼: | 四川;51 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 中文 信息 數(shù)字化 處理 方法 漢字 隨機(jī) 編碼 | ||
1.一種中文信息數(shù)字化處理方法,其特征在于:將一、二級(jí)國標(biāo)漢字按相應(yīng)的分解規(guī)范進(jìn)行拆分,拆分后的漢字信息進(jìn)行特征碼信息列表,特征碼信息列表中的每個(gè)漢字特征碼包括漢字國標(biāo)碼(GB碼)和控制碼二部分,國標(biāo)碼是漢字代碼,控制碼則標(biāo)記列表信息在該漢字拆分中的序碼。
2.根據(jù)權(quán)利要求1所述的中文信息數(shù)字化處理方法,其特征在于:一、二級(jí)國標(biāo)漢字的分解規(guī)范可以為“漢字部件規(guī)范”、“漢字筆畫規(guī)范”或“漢字拼音方案”三種。
3.一種漢字隨機(jī)編碼方法,其特征在于,包括如下步驟:
a)首先將一、二級(jí)國標(biāo)漢字按“漢字部件規(guī)范”、“漢字筆畫規(guī)范”或“漢字拼音方案”進(jìn)行拆分,拆分后的部件、聲韻母、筆劃信息進(jìn)行包括漢字國標(biāo)碼和控制碼二部分的特征碼信息列表;
b)建立漢字特征碼原始信息列表;
c)對(duì)原始信息進(jìn)行鍵位設(shè)計(jì);
d)將特征碼原始信息列表轉(zhuǎn)化為特征碼鍵位信息列表;
e)設(shè)立字、詞編碼緩沖區(qū);
f)儲(chǔ)存鍵入信息于字、詞緩沖區(qū);
g)字(或詞)結(jié)束鍵后,根據(jù)字(或詞)編碼特性從字(或詞)庫中采集編碼信息入字(或詞)編碼緩沖區(qū);
h)根據(jù)字(或詞)的編碼特性(特征數(shù)據(jù))判別該字(或詞)是否符合編碼條件,檢出編碼字(或詞),編碼處理結(jié)束。
4.根據(jù)權(quán)利要求3所述的漢字隨機(jī)編碼方法,其特征在于:在一、二級(jí)國標(biāo)漢字按“漢字拼音方案”拆分的漢語拼音信息中的聲母(21個(gè))列表,其控制碼數(shù)據(jù)均為″01″,其韻母(35個(gè))列表中控制碼數(shù)據(jù)均為″02″。
5.根據(jù)權(quán)利要求3所述的漢字隨機(jī)編碼方法,其特征在于:在一、二級(jí)國標(biāo)漢字按“漢字筆畫規(guī)范”拆分的漢字筆劃一般采用″橫、豎、撇、點(diǎn)(捺),鉤″五個(gè)筆劃,用數(shù)字鍵1-5作代碼,也可以按雙筆劃組合(5×5=25組)虛擬地排列于字符鍵上,按數(shù)字鍵操作,按字符鍵列表。
6.根據(jù)權(quán)利要求3所述的漢字隨機(jī)編碼方法,其特征在于:所述控制碼包括首部件標(biāo)記、次部件標(biāo)記、第三部件標(biāo)記、末部件標(biāo)記和尾部件標(biāo)記。
7.根據(jù)權(quán)利要求6所述的漢字隨機(jī)編碼方法,其特征在于:數(shù)字化的漢字部件信息列表采用四碼長鍵序,四碼長鍵序可兼容于二碼長和三碼長。在四碼長的鍵序中,電腦對(duì)鍵入信息的取碼是按如下規(guī)則進(jìn)行的:第一次出現(xiàn)的部件一定被看作首部件,其后為次部件、第三部件和末部件;四鍵中首次出現(xiàn)的拼音信息視作聲母,其后為韻母;四鍵中出現(xiàn)的筆劃信息依次為第一二筆、第三四筆和第五末筆。
8.根據(jù)權(quán)利要求6所述的漢字隨機(jī)編碼方法,其特征在于:在四碼長的鍵序中,不論是字編碼還是詞編碼,輸入信息可隨機(jī)變換信息類型而無需進(jìn)行切換。
9.根據(jù)權(quán)利要求6所述的漢字隨機(jī)編碼方法,其特征在于:對(duì)于字編碼,不論是輸入同類信息還是異類信息,可隨機(jī)變換字編碼的碼長(二碼長或三碼長或四碼長)。
10.根據(jù)權(quán)利要求6所述的漢字隨機(jī)編碼方法,其特征在于:在隨機(jī)編碼系統(tǒng)中一定要建立字、詞編碼緩沖區(qū),其容量包含整個(gè)字庫,分別用以儲(chǔ)存輸入的鍵位信息,并在該緩沖區(qū)中判別字或詞的編碼生成條件。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于劉陶,未經(jīng)劉陶許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201010274141.4/1.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06F 電數(shù)字?jǐn)?shù)據(jù)處理
G06F3-00 用于將所要處理的數(shù)據(jù)轉(zhuǎn)變成為計(jì)算機(jī)能夠處理的形式的輸入裝置;用于將數(shù)據(jù)從處理機(jī)傳送到輸出設(shè)備的輸出裝置,例如,接口裝置
G06F3-01 .用于用戶和計(jì)算機(jī)之間交互的輸入裝置或輸入和輸出組合裝置
G06F3-05 .在規(guī)定的時(shí)間間隔上,利用模擬量取樣的數(shù)字輸入
G06F3-06 .來自記錄載體的數(shù)字輸入,或者到記錄載體上去的數(shù)字輸出
G06F3-09 .到打字機(jī)上去的數(shù)字輸出
G06F3-12 .到打印裝置上去的數(shù)字輸出
- 信息記錄介質(zhì)、信息記錄方法、信息記錄設(shè)備、信息再現(xiàn)方法和信息再現(xiàn)設(shè)備
- 信息記錄裝置、信息記錄方法、信息記錄介質(zhì)、信息復(fù)制裝置和信息復(fù)制方法
- 信息記錄裝置、信息再現(xiàn)裝置、信息記錄方法、信息再現(xiàn)方法、信息記錄程序、信息再現(xiàn)程序、以及信息記錄介質(zhì)
- 信息記錄裝置、信息再現(xiàn)裝置、信息記錄方法、信息再現(xiàn)方法、信息記錄程序、信息再現(xiàn)程序、以及信息記錄介質(zhì)
- 信息記錄設(shè)備、信息重放設(shè)備、信息記錄方法、信息重放方法、以及信息記錄介質(zhì)
- 信息存儲(chǔ)介質(zhì)、信息記錄方法、信息重放方法、信息記錄設(shè)備、以及信息重放設(shè)備
- 信息存儲(chǔ)介質(zhì)、信息記錄方法、信息回放方法、信息記錄設(shè)備和信息回放設(shè)備
- 信息記錄介質(zhì)、信息記錄方法、信息記錄裝置、信息再現(xiàn)方法和信息再現(xiàn)裝置
- 信息終端,信息終端的信息呈現(xiàn)方法和信息呈現(xiàn)程序
- 信息創(chuàng)建、信息發(fā)送方法及信息創(chuàng)建、信息發(fā)送裝置
- 快速開啟已中斷數(shù)字化影片的方法
- 一種數(shù)字化文物安全共享系統(tǒng)
- 實(shí)驗(yàn)室復(fù)現(xiàn)式數(shù)字化電能計(jì)量設(shè)備遠(yuǎn)程校準(zhǔn)系統(tǒng)及方法
- 一種數(shù)字化諧波標(biāo)準(zhǔn)電能表以及電能檢定系統(tǒng)
- 一種數(shù)字化諧波標(biāo)準(zhǔn)諧波電能表以及電能檢定系統(tǒng)
- 數(shù)字化臺(tái)面、家用數(shù)字化書桌及教室用數(shù)字化書桌
- 殼狀牙科器械及其設(shè)計(jì)方法和制備方法
- 模擬數(shù)字化牙齒模型位姿變化的方法
- 數(shù)字化殼狀牙齒矯治器設(shè)計(jì)方法、制造方法及系統(tǒng)
- 城市軌道交通工程數(shù)字化設(shè)計(jì)成果的交付率評(píng)估方法





