[發明專利]一種漢語到英語的離線翻譯方法有效
| 申請號: | 201810064370.X | 申請日: | 2018-01-23 |
| 公開(公告)號: | CN108280066B | 公開(公告)日: | 2021-09-24 |
| 發明(設計)人: | 張斌;張鋒 | 申請(專利權)人: | 江蘇省舜禹信息技術有限公司 |
| 主分類號: | G06F40/253 | 分類號: | G06F40/253;G06F40/30;G06F40/58 |
| 代理公司: | 南京寧致知識產權代理有限公司 32520 | 代理人: | 耿欣 |
| 地址: | 210000 江蘇省南京*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 漢語 英語 離線 翻譯 方法 | ||
本發明的提供一種漢語到英語的離線翻譯方法,特別是漢語到英語的漢語到英語的離線翻譯方法,通過對漢語句子的合理分割,相近度計算,英語生成規則,得到符合要求的英文,一定程度上實現了無需依賴網絡數據庫,僅通過對待翻譯的漢語句子進行處理,同時結合設定的英語翻譯規則也能得到較為準確的翻譯結果。
技術領域
本發明屬于自動翻譯領域,具體涉及一種漢語到英語的離線翻譯方法。
背景技術
隨著智能設備的發展,智能操作系統也越來越多樣化,比如蘋果公司的IOS,谷歌公司的Android,火狐公司的Firefox OS等等,而集成了這些系統的智能設備也開始被越來越多的用戶使用,用戶使用這些設備進行游戲,社交,閱讀等等日常活動。
而隨著社會的愈來愈開放,人們現在也有著更多的機會閱讀到不屬于自己母語的內容,不論是平時愛好閱讀,或者是因專業學習,工作需求等,常常會碰到很多外語資料,目前智能設備上存在最普遍的查詢外語詞匯的方法是由用戶手動打開外語查詢應用,手動輸入單詞查詢,稍微做的好一些應用比如有道詞典。目前流行的自動翻譯方法主要有三類,第一類是基于詞的,以單詞作為翻譯的基本單位,不考慮上下文信息和人類語言學知識,翻譯時,首先查找每個源語言單詞所對應的目標語言單詞,然后插入、刪除目標語言單詞,并調整它們的順序,組合成目標語言句子,特點是翻譯虛度快,但準確度較差,第二類是基于短語的翻譯,翻譯粒度從單詞擴展到短語,較好解決局部上下文依賴問題,大大提高翻譯的流利度和準確率,第三類是基于句法的翻譯,將句法結構信息引入翻譯過程,但需要將語法結構知識引入,且需要在翻譯之前利用句法知識調整源語言語序,在翻譯之后利用句法知識做重排序。
目前來說,現有的機器自動翻譯中,第三類翻譯是趨勢,然而要想獲得較好的翻譯效果,最好是通過在線聯網的方式獲得語法結構,另外,該翻譯速度也較慢。盡管互聯網已得到了極大的普遍應用,然而,隨著環境的變化,以及各種臨時條件的出現,我們的智能設備也不能時時刻刻保持在線狀態,因此,急需一種漢語到英語的離線翻譯方法,在盡可能實現脫離網絡的情況下,也能得到較為準確的翻譯結果。
發明內容
鑒于以上分析,本發明的主要目的在于提供一種克服上述缺陷的漢語到英語的離線翻譯方法,特別是漢語到英語的漢語到英語的離線翻譯方法,通過對漢語句子的合理分割,相近度計算,英語生成規則,得到符合要求的英文,一定程度上實現了無需依賴網絡數據庫,僅通過對待翻譯的漢語句子進行處理,同時結合設定的英語翻譯規則技能得到較為準確的翻譯結果。
本發明的目的是通過以下技術方案實現的。
一種漢語到英語的離線翻譯方法,包括如下步驟:
接收輸入的漢語句子,根據漢英字典進行詞語分割,得到正確的詞語分割形式;
把待翻譯的漢語句子的某些特征作為查詢條件到數據庫中查詢出相近的句子,并且按照相近程度大小選擇出最接近的句子,即相近度計算;
根據設定的對齊規則,對齊待翻譯的漢語句子和數據庫中的句子,并且對齊數據庫中漢語句子的詞語和英文句子的詞語;
根據設定的英語翻譯規則,翻譯成符合要求的英文。
進一步地,所述詞語分割的具體步驟為,(1)設待分割的語句的長度為L,字典中最大詞語長度為M,從待分割的第一個字開始取長度為M的字符串進行匹配。(2)若能夠匹配,則將此字符串作為一個詞語,從語句中分割,將該詞語左右兩側的部分作為新的語句,繼續重復此過程進行分割;(3)若不能匹配,則從語句的第二個字繼續取長度為M的字符串進行匹配;(4)若不能匹配,則依次從語句中的第三個、第四個……第(L-M+1)個字開始取長度為M的字符串進行匹配,若匹配成功,則返回第(2)步,如果都不能匹配,則表明已經沒有長度為M的詞語,此時令M-1,再以此字符串長度,從第一個字開始,進行匹配;(5)重復上述過程,直至語句中的詞語全部分割完成。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于江蘇省舜禹信息技術有限公司,未經江蘇省舜禹信息技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810064370.X/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種外文文本評價方法及裝置
- 下一篇:耳機翻譯方法和系統





