[發明專利]漢維哈柯電子辭典及其自動轉譯漢維哈柯語的方法有效
| 申請號: | 201110426748.4 | 申請日: | 2011-12-19 |
| 公開(公告)號: | CN103164396A | 公開(公告)日: | 2013-06-19 |
| 發明(設計)人: | 尼加提·納吉米;買合木提·買買提;帕肉克·司地克;馬斌 | 申請(專利權)人: | 新疆新能信息通信有限責任公司 |
| 主分類號: | G06F17/28 | 分類號: | G06F17/28;G06F17/30;G10L15/08 |
| 代理公司: | 烏魯木齊新科聯專利代理事務所(有限公司) 65107 | 代理人: | 祁磊 |
| 地址: | 830026 新疆維吾爾自治區*** | 國省代碼: | 新疆;65 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 漢維哈柯 電子辭典 及其 自動 轉譯 漢維哈柯語 方法 | ||
1.一種漢維哈柯電子詞典,其特征是:由語種識別模塊(2)、檢索模塊(3)、檢索輸出組合模塊(4)、顯示模塊(1)、語音識別模塊(5)和語音輸出模塊(6)組成,語種識別模塊(2)通過其相應接口連接顯示模塊(1)的接口和檢索模塊(3)的接口,檢索模塊(3)通過其輸出端接口對應連接檢索輸出組合模塊(4)的輸入端接口,檢索輸出組合模塊(4)輸出端接口對應連接語音識別模塊(5)的輸入端接口,語音識別模塊(5)通過其輸出端接口連接語音輸出模塊(6)的輸入端接口。
2.一種漢維哈柯電子詞典自動轉譯漢維哈柯語的方法,其按序處理的步驟如下:
(Ⅰ)由顯示模塊(1)顯示所輸入的文字,構建取詞窗口;語種識別模塊(2)利用取詞窗口通過屏幕取詞的方法,獲取與顯示模塊(1)顯示的所輸入文字相對應的輸入字符編碼區域,將所輸入文字與事先被存儲的UNICODE標準編碼字符集中的編碼字符相比對,語種識別模塊(2)首先判斷所輸入的文字的語種是漢語文字或非漢語語種的文字;若語種識別模塊(2)判斷出所輸入文字是非漢語語種的文字,則先從所輸入非漢語語種文字獲取輸入的文本,將所輸入的非漢語語種的文本的字母與其中所存儲的維哈柯文字字母表的字母比對,以識別出上述非漢語文字的語種為維語、哈語或柯語,即最終識別出所輸入文字的語種,并將最終由語種識別模塊(2)識別出語種的所輸入非漢語文字經文字轉換環節轉換成維哈柯文斯拉夫文子、維哈柯文阿拉伯文字或維哈柯文拉丁文字,將已被識別出語種的所輸入文字傳送至檢索模塊(3);???
(Ⅱ)檢索模塊(3)獲取檢索方式將被識別出語種的所輸入文字與基礎語料庫中并列存儲的漢-維語料庫、維-漢語料庫、哈-漢語料庫和柯-漢語料庫中所存儲的字符進行比對,以從基礎語料庫中檢索出與上述被識別出語種的所輸入文字的字符相同或相對應的字符組合,確認上述被識別出語種的所輸入文字是已被存儲在基礎語料庫中的已知單字或單詞,或進一步主動完整漢語單字組合或單詞字母組合,若不能從漢-維語料庫、維-漢語料庫、哈-漢語料庫或柯-漢語料庫中檢索出與所輸入文字相同或相對應的字符組合-漢語單字或維語、哈語或柯語單詞,則檢索模塊(3)判斷上述被識別出語種的所輸入文字是未知的,不能被語種識別模塊(2)確認、接收;
(Ⅲ)語種識別模塊(2)接收檢索模塊(3)所檢索出的字符組合,并從基礎語料庫所存儲的漢-維語料庫、維-漢語料庫、哈-漢語料庫和柯-漢語料庫中調出與由檢索模塊(3)所檢索出的字符組合意思對應的且不同于所輸入文字語種的另一語種字符組合-轉譯成漢語單字、漢語單詞或維語單詞、哈語單詞、柯語單詞,再把所輸入文字和/或由語種識別模塊(2)從基礎語料庫中所調出的與所輸入文字意思相對應的另一語種字符組合通過檢索模塊(3)或直接傳至檢索輸出組合模塊(4);?
(Ⅳ)檢索輸出組合模塊(4)根據所輸入文字和/或由語種識別模塊(2)從基礎語料庫中所調出的與所輸入文字意思相對應的字另一語種符組合,從基礎語料庫中并列存儲的漢-漢語料庫、維-維語料庫、哈-哈語料庫和柯-柯語料庫中獲取用于解釋被檢索模塊(3)檢索出的字符組合意思的漢語解釋語句,再根據維哈柯文斯拉夫文字與維哈柯文阿拉伯文字映射表或維哈柯文阿拉伯文字與維哈柯文拉丁文字映射表,獲取與上述另一種字符組合意思對應的由斯拉夫字母或阿拉伯字母或拉丁字母表達的維語解釋語句、哈語解釋語句和/或柯語解釋語句,相應對由語種識別模塊(2)從基礎語料庫中所調出的字符組合的意思進行解釋,檢索輸出組合模塊(4)再將其所檢索出的解釋語句輸出至語音識別模塊(5);?
(Ⅴ)當語音識別模塊(5)判斷其所接收的上述解釋語句為漢語解釋語句時,語音識別模塊(5)用寄存于存儲器內的語音數據庫所存儲的真人漢語語音庫,相應逐一對其所接收的漢語解釋語句中的每一漢語單字按照漢語發音語序進行語音匹配,再將暫存有與其所接收漢語解釋語句中的漢語單字按序相匹配的漢語發音信號依次傳至語音輸出模塊(6),對應于漢語解釋語句中每一漢語單字的漢語發音信號被語音輸出模塊(6)逐一按序檢測、讀取后,由語音輸出模塊(6)中的揚聲器依次發出與其所接收漢語解釋語句中的每一漢語單字對應的漢語語音;
當語音識別模塊(5)判斷其所接收的解釋語句為維語解釋語句、哈語解釋語句和/或柯語解釋語句且其所接收的維語解釋語句、哈語解釋語句和/或柯語解釋語句是以阿拉伯字母或斯拉夫字母表達的單詞時,語音識別模塊(5)用語音數據庫中所存儲的真人維語語音庫、真人哈語語音庫或真人柯語語音庫,相應逐一對其所接收的維語、哈語和/或柯語解釋語句的每一單詞按照維語、哈語或柯語發音語序進行語音匹配,再將暫存有與上述其所接收的維語、哈語和/或柯語解釋語句中的單詞按序相匹配的維語、哈語或柯語發音信號傳依次傳至語音輸出模塊(6),對應于上述其所接收的維語、哈語和/或柯語解釋語句中每一單詞的發音信號被語音輸出模塊(6)逐一按序檢測、讀取后,由語音輸出模塊(6)中的揚聲器依次發出與上述其所接收的維語、哈語和/或柯語解釋語句中每一單詞相匹配的語音;若語音識別模塊(5)判斷其所接收的解釋語句為維語解釋語句、哈語解釋語句和/或柯語解釋語句,但不能對上述其所接收的維語、哈語和/或柯語解釋語句進行語音匹配時,則推定上述其所接收的維語、哈語和/或柯語解釋語句相應是以阿拉伯字母或斯拉夫字母或拉丁字母表達的維語、哈語和/或柯語文本,并調用語音數據庫中所存儲的合成維語語音庫、合成哈語語音庫和合成柯語語音庫對維語、哈語和/或柯語文本進行基于音節的語音合成,通過維語、哈語或柯語語句單詞與音節切分法相應將維語、哈語和/或柯語文本切分成已知存儲于合成語音庫中的維語、哈語或柯語單詞,再用真人維語語音庫、真人哈語語音庫、真人柯語語音庫和/或合成維語語音庫、合成哈語語音庫、合成柯語語音庫,相應逐一對上述維語、哈語和/或柯語文本中每一單詞按照維語、哈語或柯語發音語序進行語音匹配,再將暫存有與維語、哈語和/或柯語文本被按序所切分出的單詞相相匹配的維語、哈語或柯語發音信號依次傳至語音輸出模塊(6),維語、哈語或柯語發音信號被語音輸出模塊(6)逐一按序檢測、讀取后,由語音輸出模塊(6)中的揚聲器依次發出與維語、哈語和/或柯語文本中每一單詞相匹配的語音。
3.根據權利要求2所述的漢維哈柯電子詞典自動轉譯漢維哈柯語的方法,其特征是:所述的檢索方式為首部檢索方式、尾部檢索方式或包含檢索方式;
首部檢索方式為:A、檢索模塊(3)從左向右按序逐一錄入所輸入文字中的每個字符,B、將基礎語料庫所存儲的字符組合與被錄入的所輸入文字字符組合相比對,若能從基礎語料庫中搜索出與被錄入的文字字符組合相同的字符,則停止檢索,即完成精確匹配出所輸入文字的工作;若不能通過首部檢索方式從基礎語料庫中搜索出與所輸入文字相同的字符組合,則采用如下的尾部檢索方式繼續檢索所輸入的文字;
尾部檢索方式為:①檢索模塊(3)從右向左(按照人面對的左邊、右邊)按序逐一錄入所輸入的文字中的每個字符,②同上述首部檢索方式的步驟B;若不能通過首部檢索方式從基礎語料庫中搜索出與所輸入文字相同的字符,則采用如下的包含檢索方式繼續檢索所輸入的文字;
包含檢索方式為從任意方向匹配所輸入文字的字符組合的檢索方式,包括上述首部檢索方式與尾部檢索方式。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于新疆新能信息通信有限責任公司,未經新疆新能信息通信有限責任公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201110426748.4/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種安全傳輸數據方法,裝置和系統
- 下一篇:車輛用主缸





