[發明專利]語句輸入法的自然分詞和混合輸入無效
| 申請號: | 200810032852.3 | 申請日: | 2008-01-22 |
| 公開(公告)號: | CN101493727A | 公開(公告)日: | 2009-07-29 |
| 發明(設計)人: | 劉嘯旻 | 申請(專利權)人: | 劉嘯旻 |
| 主分類號: | G06F3/023 | 分類號: | G06F3/023;H04M1/23 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 215400*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 語句 輸入法 自然 分詞 混合 輸入 | ||
(一)技術領域
本發明涉及一種漢字輸入方法,具體為通過使用者的語感停頓來自然分詞,通過選擇提示鍵來混合輸 入英文字符的一種漢字輸入方法。使用漢語拼音作為編碼時,它符合漢語拼音正詞法規則,能自由輸入中 英文字符,與其他輸入法相比,十分自然流暢。
(二)背景技術
當前的中文輸入中的拼音輸入法無論是語句輸入法或詞輸入法,在輸入拼音碼時都沒有對詞進行分詞 連寫,而是由程序來進行智能分詞,即編碼是連續無分割的或者是按字分割的,例如輸入:“漢語拼音”, 編碼輸入成:“hanyupinyin”或被分割成“han?yu?pin?yin”,而不是“hanyu?pinyin”。
雖然計算機的軟硬件技術不斷發展,自然語言方面的研究也在不斷進步,但是計算機智能分詞始終不 能達到人們滿意的效果。詞是語言的基礎單位,詞與詞之間本身是分割的,只是在用漢字對漢語語言進行 表示時使用了連續的形式,當用拼音表示是否一定還要用連續的方式進行就值得商榷。如果因為計算機自 然語言處理為我們提供了自動分詞的技術,我們就必須采用連續的拼音形式進行漢字處理,那就變成了為 技術而技術,是一條違反語言規律的道路。漢語拼音不是拼音文字,但它是一種擬文字的形式,如果拼 音采用連續的形式,就不符合文字的基本特征,漢字的每個字之間也是分開的,而不是一堆連續的筆劃。
雖然采用連寫無分割的編碼的輸入法的可用性在不斷提高,但無法掩蓋以下幾個缺點:
(1)分詞的影響。對連續的編碼的進行漢字轉換,需要對結果進行分詞。雖然分詞技術和效率在 不斷發展,但在有限的文本環境下,不可能做到100%的正確,一個不正確的分詞就可能導致 整個語句的轉換錯誤。另外分詞需要龐大的知識庫支持,分詞的處理消耗很多的計算機處理 器時間,對性能的影響很大。
(2)錯誤的字詞不容易及時修改。由于分詞錯誤和重碼的存在,轉換錯誤不可避免。連續的編碼 輸入對于錯誤如進行立即修改,該句的此次輸入就結束了,如不立即修改——就像提倡那樣, 等到語句結束時再修改,就要出現查找定位錯誤,無論怎樣都會對使用者的思維過程造成干 擾。
(3)不能更有效的使用簡拼。使用簡拼可以很有效地提高輸入速度,又不影響思維的連續,然而 在連續的編碼中如果使用簡拼,將會加大錯誤出現的,甚至完全使輸入混亂。
(4)不能方便的插入英文字符。在信息化時代,英文越來越多地出現的漢字文本中,連續編碼的 輸入中是很難插入英文字符的,需要不停地按切換鍵才能輸入。
(5)違反拼音正詞法規范,對漢語拼音的學習和發展是有害的。國家標準GB/T16159-1996《漢語 拼音正詞法基本規則》規定:漢語拼音以詞為拼寫單位,一個詞內部的音節要連寫,兩詞之 間要留空格。連續編碼的輸入方式,將原本一個個詞的拼音掩蓋在一長串的字母中,人為的 增加了處理資源的消耗和技術難度,也影響了漢語拼音的發展。
從上面的分析中可以看出,采用符合漢語拼音正詞法的拼音輸入方式,人工以空格來自然分詞的 方法,不僅可以增加輸入的準確性,提高處理效率,而且符合語言文字本身的規律。
(三)發明內容
本發明引入一種人工自然分詞方法,使用漢語拼音作為編碼時,它可以符合漢語拼音正詞法規則,同 時本方法還包含一種混合輸入英文字符的方法,使在用語句的方式進行漢字輸入時,十分自然流暢。此方 法的誕生有望提高語句輸入法的效率和可用性。
發明的內容說明如下
(1)自然分詞
當輸入一段表示詞的編碼后,按下特定的鍵(在計算機的鍵盤上,此鍵專指空格鍵和數字選擇鍵,其 中空格鍵作為分詞鍵)表示詞的結束,但并不表示語句的輸入結束,不將結果詞顯示在文本的光標位置, 而是將結果詞顯示在輸入法的候選攔中,此時該詞的編碼加上一個空格(空白字符)顯示在輸入法的編碼編 輯欄中。
當輸入下一個詞時按照同樣的方式將編碼和詞分別追加顯示在編碼編輯欄和候選欄中。
當沒有輸入編碼而僅輸入分詞鍵時,作為輸入結束處理,將整個轉換結果顯示在目標文本的光標位置。
當輸入的詞的編碼超過一個而用戶沒有輸入分詞鍵時,輸入法程序根據內部的分詞算法的判定,自動 在首個未分詞的詞之后插入分詞鍵。
在以分詞鍵結束輸入后,沒有輸入編碼而僅輸入標點“,.?;”時,作為輸入結束處理,將整個轉換結 果顯示在目標文本的光標位置。
(2)混合輸入
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于劉嘯旻,未經劉嘯旻許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/200810032852.3/2.html,轉載請聲明來源鉆瓜專利網。





