[發明專利]基于嵌入式系統的哈薩克文連寫判斷與存儲方法在審
| 申請號: | 201310740856.8 | 申請日: | 2013-12-29 |
| 公開(公告)號: | CN104298656A | 公開(公告)日: | 2015-01-21 |
| 發明(設計)人: | 柴雨峰;李滿樹;楊志杰;汪振東;倪凱峰;塔拉甫·加盤 | 申請(專利權)人: | 新疆信息產業有限責任公司 |
| 主分類號: | G06F17/27 | 分類號: | G06F17/27;G06F17/20 |
| 代理公司: | 烏魯木齊新科聯知識產權代理有限公司 65107 | 代理人: | 祁磊 |
| 地址: | 830011 新疆維吾爾自治區*** | 國省代碼: | 新疆;65 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 嵌入式 系統 哈薩克 連寫 判斷 存儲 方法 | ||
技術領域
本發明涉及語言軟處理技術,特別是基于嵌入式系統的哈薩克文連寫判斷與存儲方法。
背景技術
近年來,隨著少數民族信息化以及自動化領域的發展,在新疆基于嵌入式系統的智能設備在少數民族中也有了比較廣泛的應用,但各地區、各民族之間的文化水平差異較大,使為達到少數民族用戶充分應用智能終端設備的目標很難被實現。
發明內容
本發明的目的在于提供一種基于嵌入式系統的哈薩克文連寫判斷與存儲方法,能解決當今哈薩克語輸入效率慢、存儲速率慢,所需存儲空間大的問題,并研發出根據適用于哈薩克文語言特點的拼寫和存儲方法。
本發明的目的是這樣實現的:一種基于嵌入式系統的哈薩克文連寫判斷與存儲方法,①根據哈薩克文語言特點,以哈薩克文unicode擴展碼為基礎,使哈薩克文詞頭、詞中、詞尾各自構成字符集而且其在詞頭,詞中和詞尾位置的不同及字形的變化并根據判斷是否是詞的前連,后連,中間(即前后連)或單獨一個詞,進行變形;②設計了一種字庫提取方法,以標準8×16字庫為基準,取出智能終端界面顯示實際用到的哈薩克文字,將其生成一個新的精簡哈薩克文字庫。
本發明能解決當今哈薩克語輸入效率慢、存儲速率慢,所需存儲空間大的問題,并研發出根據適用于哈薩克文語言特點的拼寫和存儲方法。
附圖說明
下面將結合附圖對本發明作進一步說明。
圖1為本發明的工作流程圖。
具體實施方式
一種基于嵌入式系統的哈薩克文連寫判斷與存儲方法,如圖1所示,①根據哈薩克文語言特點,以哈薩克文unicode擴展碼為基礎,使哈薩克文詞頭、詞中、詞尾各自構成字符集而且根據判斷是否是詞的前連,后連,中間(即前后連)或單還是獨一個詞,相應對其進行變形;②以標準8×16字庫為基準,取出智能終端界面顯示實際用到的哈薩克文字,將其生成一個新的精簡哈薩克文字庫。
本發明仍然遵循哈薩克文變形規則。哈薩克文變形規則為:哈薩克文字屬于阿拉伯文字系列,阿拉伯文字在伊斯蘭教的影響下流傳很廣。波斯文,烏爾都文以及我國的新疆的哈薩克、柯爾克孜文等多種文字采用阿拉伯字母。哈薩克文的字母沒有大寫和小寫的區分,但有印刷體和書寫體的區別,而且除去五個字母以外,其他29個字母都可以和后面的字母連寫,而且因其在詞頭,詞中和詞尾的位置不同,字形也有所變化。哈薩克文字的書寫方向和中文不同,它是自右向左橫著寫,因此,哈薩克文書籍和本子都是右開本的。
在換行的時候,一般的,我們需要判斷一下是否是整個詞,進行整個詞的換行,而不能把詞拆成兩個部分。哈薩克文里面的數字仍然采用從左往右的顯示方式。因此,哈薩克文單詞分段法可分成first、last、middle及alone,并根據判斷是否是詞的前連(前面字符在集合1中),后連(后面字符在集合2中),中間(即前后連,前面字符在集合1中,后面字符在集合2中)或還是單獨一個詞,進行相應變形。
根據上述分析,給出變形的數組:分別對應上面的情況。對于其它不在數組中的,其變形和自身相同,具體判斷方法如下例:
const?WORD?Arbic_Position[][4]=//first,last,middle,alone
{
{0xfe90,0xfe91,0xfe92,0xfe8f},//0x628
{0xfe94,0xfe93,0xfe93,0xfe93},
{0xfe96,0xfe97,0xfe98,0xfe95},//0x62A
{0xfe9a,0xfe9b,0xfe9c,0xfe99},
{0xfe9e,0xfe9f,0xfea0,0xfe9d},
{0xfea2,0xfea3,0xfea4,0xfea1},
{0xfea6,0xfea7,0xfea8,0xfea5},
{0xfeaa,0xfea9,0xfeaa,0xfea9},
……
}
判斷是否是連接前面的,采用判斷該字符前一個字符的判定方法,方法是,看前一個字符是否在集合set1中。如果在,則是有連接前面的。集合1如下:
tatic?U16theSet1[23]={
0x62c,0x62d,0x62e,0x647,0x639,0x63a,0x641,0x642,
0x62b,0x635,0x636,0x637,0x643,0x645,0x646,0x62a,
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于新疆信息產業有限責任公司,未經新疆信息產業有限責任公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201310740856.8/2.html,轉載請聲明來源鉆瓜專利網。





