[發明專利]漢維哈柯電子辭典及其自動轉譯漢維哈柯語的方法有效
| 申請號: | 201110426748.4 | 申請日: | 2011-12-19 |
| 公開(公告)號: | CN103164396A | 公開(公告)日: | 2013-06-19 |
| 發明(設計)人: | 尼加提·納吉米;買合木提·買買提;帕肉克·司地克;馬斌 | 申請(專利權)人: | 新疆新能信息通信有限責任公司 |
| 主分類號: | G06F17/28 | 分類號: | G06F17/28;G06F17/30;G10L15/08 |
| 代理公司: | 烏魯木齊新科聯專利代理事務所(有限公司) 65107 | 代理人: | 祁磊 |
| 地址: | 830026 新疆維吾爾自治區*** | 國省代碼: | 新疆;65 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 漢維哈柯 電子辭典 及其 自動 轉譯 漢維哈柯語 方法 | ||
技術領域
本發明屬于機器翻譯語言技術領域,涉及利用計算機軟硬件使漢語與維吾爾語、哈薩克語和柯爾克孜語相互轉譯的語言轉換技術,特別是漢維哈柯電子辭典及其自動轉譯漢維哈柯語的方法。
背景技術
在社會信息化的當代,人們對各類語種信息獲取、查詢、翻譯提出了更快、更高的要求,隨之而研制開發了各類電子辭典產品,大到含幾十萬詞條、上萬個媒體素材的電子多媒體百科全書,小到含幾千詞條的掌上快譯通,受到廣大用戶歡迎,電子辭典被作為學習語言、翻譯和快速查詢的輔助工具。在國外機器翻譯系統和自然語言處理系統的實用化進程中,機器辭典已儼然成為開發的焦點,越來越多的語言翻譯技術專家把機器辭典的規模和質量看作是決定機器翻譯系統和自然語言處理系統成敗的關鍵,早在1986年日本通產省就出資1億美元支持電子辭典(EDR)的一個9年的開發計劃,歐共體也資助多項機器辭典的研究課題,其中包括ACQUILEX(The?Acquisition?of?Lexical?Knowledge)課題,其目標是通過多部機器可讀辭典MRD(Machine?Reading?Dictionary)來自動獲取詞匯知識,以便建立支持自然語言處理的多語種詞匯知識庫LKB(Lexical?Knowledge?Base),在此基礎上所開發的各語種的多部大型機器辭典,其種類包括基本辭典、術語辭典、搭配辭典、概念分類辭典、概念描寫辭典、語法辭典等。目前,產品化的電子辭典種類繁多,如不列顛百科全書、柯普頓百科全書、ENCARTA等。?
在我國,涉及機器翻譯辭典方面的研究則始于二十世紀50、60年代,在改革開放之后得到了充分重視,二十世紀80年代后期,中文信息處理領域的專家開始了對機器辭典的研究,二十世紀90年代初,面向信息處理的機器辭典的研究正式列入國家七五、八五、九五計劃,開展了諸如《信息處理用現代漢語詞匯研究》、《基于配價的漢語語義辭典》、《現代漢語語法信息辭典》等基礎性研究課題,在此基礎上開發了《中國大百科全書》、《金山詞霸》、《東方大典》等較成熟的信息產品,受到了廣大用戶的歡迎。
近年來,隨著少數民族文字信息化領域的持續快速發展,在我國新疆,有關少數民族語言的電子辭典也有了比較大的發展,但大多數以現有普通的漢維電子辭典為主,并沒有滿足更廣大用戶的實際需求,更多支持少數民族語言翻譯技術的水平存在著較大的缺陷。
發明內容
本發明的目的在于提供一種漢維哈柯電子辭典,其結構合理,通用性強。
本發明的目的是這樣實現的:一種漢維哈柯電子辭典,由語種識別模塊、檢索模塊、檢索輸出組合模塊、顯示模塊、語音識別模塊和語音輸出模塊組成,語種識別模塊通過其相應接口連接顯示模塊的接口和檢索模塊的接口,檢索模塊通過其輸出端接口對應連接檢索輸出組合模塊的輸入端接口,檢索輸出組合模塊輸出端接口對應連接語音識別模塊的輸入端接口,語音識別模塊通過其輸出端接口連接語音輸出模塊的輸入端接口。
本發明的目的還在于提供一種漢維哈柯電子辭典自動轉譯漢維哈柯語的方法,改變原先傳統、普通漢語與維吾爾語、哈薩克語和柯爾克孜語互譯的辭典技術,提高漢語和維吾爾語、哈薩克語和柯爾克孜語相互轉譯的效率,改進對維吾爾語、哈薩克語和柯爾克孜語文字進行語音放送的性能(維哈柯語為維吾爾語文、哈薩克語文和/或柯爾克孜語文的簡稱)。
本發明的目的是這樣實現的:一種漢維哈柯電子辭典自動轉譯漢維哈柯語的方法,其按序處理的步驟如下:
(Ⅰ)由顯示模塊顯示所輸入的文字,構建取詞窗口;語種識別模塊利用取詞窗口通過屏幕取詞的方法,獲取與顯示模塊顯示的所輸入文字相對應的輸入字符編碼區域,將所輸入文字與事先被存儲的UNICODE標準編碼字符集(通用字符集:Universal?Multiple-Octet?Coded?Character?Set)中的編碼字符相比對,語種識別模塊首先判斷所輸入的文字的語種是漢語文字或非漢語語種的文字;若語種識別模塊判斷出所輸入文字是非漢語語種的文字,則先從所輸入非漢語語種文字獲取輸入的文本,將所輸入的非漢語語種的文本的字母與其中所存儲的維哈柯文字字母表的字母比對,以識別出上述非漢語文字的語種為維語、哈語或柯語,即最終識別出所輸入文字的語種,并將最終由語種識別模塊識別出語種的所輸入非漢語文字經文字轉換環節轉換成維哈柯文斯拉夫文子、維哈柯文阿拉伯文字或維哈柯文拉丁文字,將已被識別出語種的所輸入文字傳送至檢索模塊;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于新疆新能信息通信有限責任公司,未經新疆新能信息通信有限責任公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201110426748.4/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種安全傳輸數據方法,裝置和系統
- 下一篇:車輛用主缸





