[發(fā)明專利]一種漢字輸入過程中的漢語拼音串處理方法及其系統(tǒng)無效
| 申請?zhí)枺?/td> | 201010134541.5 | 申請日: | 2010-03-25 |
| 公開(公告)號: | CN102200839A | 公開(公告)日: | 2011-09-28 |
| 發(fā)明(設(shè)計)人: | 薛永剛;陳培軍;秦吉勝;侯磊 | 申請(專利權(quán))人: | 阿里巴巴集團控股有限公司 |
| 主分類號: | G06F3/023 | 分類號: | G06F3/023 |
| 代理公司: | 北京同達信恒知識產(chǎn)權(quán)代理有限公司 11291 | 代理人: | 郭潤湘 |
| 地址: | 英屬開曼群島大開曼*** | 國省代碼: | 開曼群島;KY |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 漢字輸入 過程 中的 漢語拼音 處理 方法 及其 系統(tǒng) | ||
1.一種漢字輸入過程中的漢語拼音串處理方法,其特征在于,包括如下步驟:
對接收到的漢語拼音串進行切分,分別將所述漢語拼音串中的聲母和韻母作為切分子串得到切分子串序列;
對所述切分子串序列中的切分子串進行擴展,并根據(jù)擴展結(jié)果生成擴展子串序列集合;
按照音節(jié)組成特征對所述擴展子串序列集合中每個擴展子串序列進行音節(jié)抽取,得到對應(yīng)的音節(jié)序列;
對各音節(jié)序列中的音節(jié)進行合法性驗證,并根據(jù)驗證結(jié)果刪除包含有非法音節(jié)的音節(jié)序列。
2.如權(quán)利要求1所述的方法,其特征在于,分別將所述漢語拼音串中的聲母和韻母作為切分子串,包括:
如果相鄰的至少兩個聲母字母具備組合為多字母聲母的條件,則將該相鄰的至少兩個聲母字母組合并作為一個切分子串;
如果相鄰的至少兩個韻母具備組合為合法的韻母組合的條件,則將該相鄰的至少兩個韻母組合并作為一個切分子串。
3.如權(quán)利要求1所述的方法,其特征在于,對接收到的漢語拼音串進行切分,還包括:
如果所述漢語拼音串中存在聲母后未跟隨韻母的聲母,則將該聲母作為一個切分子串。
4.如權(quán)利要求1所述的方法,其特征在于,對接收到的漢語拼音串進行切分,還包括:
如果元音字母與其后的多個字母具備順序組合得到韻母的條件,則取該元音字母與其后的多個拼音字母組合得到的韻母長度最長的字母串作為一個切分子串。
5.如權(quán)利要求1所述的方法,其特征在于,對所述切分子串序列中的切分子串進行擴展,包括:
如果切分子串為單字母聲母切分子串且該單字母聲母具備變換為雙字母聲母的條件,則將該切分子串中的單字母聲母擴展為雙字母聲母得到擴展子串;
如果切分子串為雙字母聲母切分子串且該雙字母聲母具備變換為單字母聲母的條件,則將該切分子串中的雙字母聲母擴展為單字母聲母得到擴展子串。
6.如權(quán)利要求5所述的方法,其特征在于,如果切分子串自身為聲母子串或韻母子串,則擴展生成的擴展子串序列包括其自身。
7.如權(quán)利要求5所述的方法,其特征在于,對所述切分子串序列中的切分子串進行擴展,還包括:
如果相鄰的切分子串都為聲母切分子串,則分別在該相鄰的聲母切分子串后增加具備與各聲母切分子串組合條件的韻母子串,得到與各聲母切分子串對應(yīng)的至少一個擴展子串。
8.如權(quán)利要求1所述的方法,其特征在于,對所述切分子串序列中的切分子串進行擴展,包括:
如果切分子串包括多個韻母組合,則將該多個韻母作為一個擴展子串;
如果切分子串包括以n結(jié)尾的鼻韻母且該鼻韻母具備增加g以變換為以g結(jié)尾的鼻韻母的條件,則將該以n結(jié)尾的鼻韻母擴展為以g結(jié)尾的鼻韻母并作為一個擴展子串;
如果切分子串包括以g結(jié)尾的鼻韻母且該鼻韻母具備刪除g以變換為以n結(jié)尾的鼻韻母的條件,則將該以g結(jié)尾的鼻韻母擴展為以n結(jié)尾的鼻韻母并作為一個擴展子串。
9.如權(quán)利要求8所述的方法,其特征在于,對所述切分子串序列中的切分子串進行擴展,還包括:
如果切分子串包括由多字母組成的韻母且該韻母具備分割為零聲母韻母和聲母的條件,則將該切分子串?dāng)U展為包括零聲母韻母和聲母的擴展子串;
如果切分子串包括由多字母組成的韻母且該韻母具備分割為韻母和零聲母韻母的條件,則將該切分子串?dāng)U展為包括韻母和零聲母韻母的擴展子串。
10.如權(quán)利要求1所述的方法,其特征在于,對接收到的漢語拼音串進行切分,分別將所述漢語拼音串中的聲母和韻母作為切分子串得到切分子串序列,包括:
遍歷接收到的漢語拼音串,將遍歷到的拼音字母或字母組合與預(yù)先按照設(shè)定的切分規(guī)則配置的切分規(guī)則表中所包含的拼音字母或字母組合進行匹配,如果在該規(guī)則表中匹配到相應(yīng)的字母或字母組合,則將遍歷到的字母或字母組合作為所述漢語拼音串的一個切分子串;
將所述漢語拼音串的切分子串按照遍歷順序組合,得到所述漢語拼音串的切分子串序列。
11.如權(quán)利要求1所述的方法,其特征在于,對所述切分子串序列中的切分子串進行擴展,包括:
對于切分子串序列中的每一個切分子串,通過查詢按照設(shè)定的擴展規(guī)則配置的擴展規(guī)則表,以查找與每一個切分子串對應(yīng)的擴展子串。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于阿里巴巴集團控股有限公司,未經(jīng)阿里巴巴集團控股有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201010134541.5/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 上一篇:可就座的立體花卉種植設(shè)施
- 下一篇:一種水稻首脫式收獲機
- 同類專利
- 專利分類
G06F 電數(shù)字數(shù)據(jù)處理
G06F3-00 用于將所要處理的數(shù)據(jù)轉(zhuǎn)變成為計算機能夠處理的形式的輸入裝置;用于將數(shù)據(jù)從處理機傳送到輸出設(shè)備的輸出裝置,例如,接口裝置
G06F3-01 .用于用戶和計算機之間交互的輸入裝置或輸入和輸出組合裝置
G06F3-05 .在規(guī)定的時間間隔上,利用模擬量取樣的數(shù)字輸入
G06F3-06 .來自記錄載體的數(shù)字輸入,或者到記錄載體上去的數(shù)字輸出
G06F3-09 .到打字機上去的數(shù)字輸出
G06F3-12 .到打印裝置上去的數(shù)字輸出





