[其他]使用漢語拼音的漢字?jǐn)?shù)據(jù)處理和字處理的方法和裝置無效
| 申請?zhí)枺?/td> | 86105610 | 申請日: | 1986-06-14 |
| 公開(公告)號: | CN86105610A | 公開(公告)日: | 1987-06-10 |
| 發(fā)明(設(shè)計)人: | 葉漳民 | 申請(專利權(quán))人: | 葉漳民 |
| 主分類號: | G06F3/023 | 分類號: | G06F3/023 |
| 代理公司: | 中國專利代理有限公司 | 代理人: | 李先春 |
| 地址: | 美國新*** | 國省代碼: | 暫無信息 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 使用 漢語拼音 漢字 數(shù)據(jù)處理 字處理 方法 裝置 | ||
供參考的相關(guān)申請
本申請是申請?zhí)枮镹o.745,302的美國專利的繼續(xù)部分,該專利的申請日為1985.6.14,現(xiàn)已放棄。
發(fā)明背景
本發(fā)明為用于指示漢語數(shù)據(jù)和漢字處理的方法及設(shè)備,特別是利用規(guī)定的漢語拼音的處理方法和設(shè)備,這將避免由於同音異義和同音而引起的含糊。
現(xiàn)代漢字首先是多音節(jié)的,按照傳統(tǒng)慣例,書寫的每一個漢字由一個或多個表意文字所組成,它們是一個概念或一種事物的形象化的表示方法。每一個表意文字都有一個單音節(jié)的發(fā)音。然而,由于在口語中,漢字包括大量的同音異義字,這些字(系指表意字)寫法不同或者意義不同,卻具有同樣的聲音,因而使用單音節(jié)字是不夠的。那也就是說,一單個的漢語口頭音節(jié)能表示許多不同的表意文字,因此,也就能表示許多不同的意義。這種情況,使得用單音節(jié)字進(jìn)行口頭交換成為不實際的情形。
為了克服這個困難,一種首先是多音節(jié)的口頭語言已逐漸形成,它把一個復(fù)雜的表意文字排成一串,形成一個多音節(jié)字,這樣在很大的程度上減少了這種字具有多個函意的可能性,結(jié)果,口頭漢語約有80%的多音節(jié)字(75%為雙音節(jié)字)。現(xiàn)代的書寫漢字已經(jīng)效仿口語,結(jié)果,在書寫漢字中采用了許多表意文字復(fù)合詞,它們都是多音節(jié)字。
在現(xiàn)代漢語中大約使用8000個表意文字,而全部表意文字略超過50,000個,其中多數(shù)是很少使用的,而且在日常語言中也不出現(xiàn)。在1981年,中華人民共和國建立了6,763個表意文字標(biāo)準(zhǔn)集,用于中國的廣播系統(tǒng),結(jié)果約8000個基本表意漢字能應(yīng)付漢字的實際應(yīng)用。
在中國對使用表意文字享有強(qiáng)烈的文化上的偏見,并將它視作為一種民族統(tǒng)一的力量。由于這個原因,任何漢字處理系統(tǒng)或漢字?jǐn)?shù)據(jù)處理系統(tǒng)最好能以漢字表意文字作為其輸出,但是以表意文字作為直接輸入手段是不實際的,因為它要求在鍵盤上能夠容納很大數(shù)量的表意文字(約8000個)。同樣,由于表意文字不可能用字母標(biāo)記,致使處理或管理表意文字成為困難而麻煩的事情。然而對數(shù)據(jù)和字處理系統(tǒng)而言,重要的是輸出表意文字,而且這種輸出對漢字處理是足夠的,對數(shù)據(jù)處理是不夠的。由于表意文字不能用字母標(biāo)記,故不可能使任何數(shù)據(jù)處理系統(tǒng)輸出的表意文字轉(zhuǎn)成按字母表順序排列的的形式,這就妨礙了高效詞典,電話薄,個人索引薄和其他的分類目錄或按字母表順序排列的目錄的建立,因此,要求具有能夠用按字母表順序排列分類編目的但卻不用表意文字表示的漢字處理系統(tǒng)。
為克服上述困難問題,中國政府已經(jīng)擬定了按字母表順序排列的方案來代表漢字表意文字的方案,這種稱之謂漢語拼音的語言代表了官方(北京方言)的讀法。北京方言具有大約400個不同的單音節(jié)聲音。拼音依靠25個英文字母(不用V)代表所有這400個聲音。這種純語音基準(zhǔn)使拼音取得了成功的效果。在漢語中具有21個輔音字母和16個元音字母(聲音“I”,“u”和“ü”可以加到其他元音字母上去,結(jié)果得到附加的18個復(fù)合元音聲音)。以上每個聲音都能夠唯一地用一個或者多個拼音字母的組合來表示。這樣在輸入和輸出端都采用拼音的系統(tǒng),導(dǎo)致了漢字處理系統(tǒng)在處理效率或方便性等方面的改善。
但是,為了得到表意文字輸出,這種處理系統(tǒng)最初的缺陷在于需要區(qū)分表意漢字中的大量的同音異義字。假定一個劣等字典具有8000個表意文字,每一個漢字音節(jié)(對應(yīng)一單個表意文字)平均具有20個同音異義字(因為漢語中大約有400個不同的聲音音節(jié)),因此,平均的結(jié)果,一個拼音音節(jié)區(qū)分20個不同的表意文字。在某些情況下,對于一個給定的聲音,同音異義字將超過150個。
由于漢語大約80%是多音節(jié)的,而且僅僅用若干有限的表意文字組合構(gòu)成多音節(jié)字,關(guān)于這個問題,在計算機(jī)應(yīng)用中,能采取將多音節(jié)拼音的字典式目錄儲存在計算機(jī)存儲器中的方法部分地加以克服。當(dāng)送入一個多音節(jié)拼音字時,能夠區(qū)分出表意文字的有限量的可能組合,而通常能用多音節(jié)字唯一地區(qū)分表意文字的簡單組合。但是,使用多音節(jié)字典式目錄比使用純單音節(jié)(表意文字)字典式目錄要求更大的存儲容量,而且將明顯增加從拼音輸入到表意文字輸出的處理時間。甚至由于存儲了大量的多音節(jié)字典式目錄,漢字所突出的同音異義的特點(雙音節(jié)漢字的40%具有同音異義字)妨礙了在拼音和表意文字之間進(jìn)行唯一而單值的變換。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于葉漳民,未經(jīng)葉漳民許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/86105610/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06F 電數(shù)字?jǐn)?shù)據(jù)處理
G06F3-00 用于將所要處理的數(shù)據(jù)轉(zhuǎn)變成為計算機(jī)能夠處理的形式的輸入裝置;用于將數(shù)據(jù)從處理機(jī)傳送到輸出設(shè)備的輸出裝置,例如,接口裝置
G06F3-01 .用于用戶和計算機(jī)之間交互的輸入裝置或輸入和輸出組合裝置
G06F3-05 .在規(guī)定的時間間隔上,利用模擬量取樣的數(shù)字輸入
G06F3-06 .來自記錄載體的數(shù)字輸入,或者到記錄載體上去的數(shù)字輸出
G06F3-09 .到打字機(jī)上去的數(shù)字輸出
G06F3-12 .到打印裝置上去的數(shù)字輸出
- 數(shù)據(jù)處理設(shè)備,數(shù)據(jù)處理方法,和數(shù)據(jù)處理程序
- 數(shù)據(jù)處理電路、數(shù)據(jù)處理裝置、數(shù)據(jù)處理方法、數(shù)據(jù)處理控制方法
- 數(shù)據(jù)處理設(shè)備、數(shù)據(jù)處理方法和數(shù)據(jù)處理程序
- 數(shù)據(jù)處理裝置、數(shù)據(jù)處理方法及數(shù)據(jù)處理程序
- 數(shù)據(jù)處理裝置、數(shù)據(jù)處理方法及計算機(jī)可讀取的記錄介質(zhì)
- 數(shù)據(jù)處理裝置、數(shù)據(jù)處理方法和數(shù)據(jù)處理程序
- 數(shù)據(jù)處理裝置、數(shù)據(jù)處理方法和數(shù)據(jù)處理程序
- 數(shù)據(jù)處理裝置、數(shù)據(jù)處理方法以及數(shù)據(jù)處理程序
- 數(shù)據(jù)處理裝置、數(shù)據(jù)處理方法以及數(shù)據(jù)處理程序
- 數(shù)據(jù)處理裝置、數(shù)據(jù)處理方法和數(shù)據(jù)處理程序





