[發明專利]一種基于機器翻譯的專名翻譯方法有效
| 申請號: | 201410406501.X | 申請日: | 2014-08-18 |
| 公開(公告)號: | CN104239293B | 公開(公告)日: | 2017-07-04 |
| 發明(設計)人: | 江潮;張芃 | 申請(專利權)人: | 武漢傳神信息技術有限公司 |
| 主分類號: | G06F17/28 | 分類號: | G06F17/28;G06F17/27 |
| 代理公司: | 北京康盛知識產權代理有限公司11331 | 代理人: | 張宇峰 |
| 地址: | 430073 湖北省武漢市東湖開發區光谷軟件*** | 國省代碼: | 湖北;42 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 機器翻譯 專名 翻譯 方法 | ||
技術領域
本發明涉及翻譯技術領域,尤其是涉及一種基于機器翻譯的專名翻譯方法。
背景技術
專名的翻譯是翻譯中一個重要的方面,由于其特殊性,雖然許多專名雖然按音譯翻譯不是完全準確,但長期以來約定俗成是固定翻譯的,所以應該以固定的翻譯結果出現,否則對于譯文的理解就會產生很大的偏差,比如按韋氏拼音拼寫的“蔣介石”的英文名“Chiang Kai-shek”被誤譯成“常凱申”就是一種非常嚴重的誤翻譯。專名的翻譯包括人名、地名、機構名、媒體名、文藝作品名、品牌名等各類專有名詞的翻譯,在文字系統相同和相似的語言間,由于書同文的便利,源語言名稱往往能夠以原文的書寫形式被目的語直接借用,而在文字系統各不相同的語言間,由于文字兼容性不足,導致在專名翻譯中音譯、語義翻譯、重新命名等多樣化轉換方式的存在,從而使得專名翻譯的規范化存在困難。
發明內容
本發明的目的之一是提供一種基于機器翻譯的專名翻譯方法,以解決現有技術中對專名翻譯的準確性低的問題。
在一些說明性實施例中,所述獲取專業詞匯譯文的方法,包括:構建專名映射表,其過程包括:提取翻譯參考文檔庫中包含有專名w的文本段落,建立文本集R;提取專名庫中專名w的專名關聯詞集W={w1,w2,…,wm};其中,w1,w2,…,wm分別為w的關聯詞;根據所述文本集和專名關聯詞集,確定關聯項,并計算出每個關聯項的關聯系數,建立所述專名映射表;對待譯文檔進行分詞處理,建立詞語集;將所述詞語集中的每個詞語在專名映射表中進行匹配,將匹配成功的詞語作為候選專名;確定每個所述候選專名在所述待譯文檔中特定段落中具有的關聯項,以及每個關聯項的關聯系數;根據每個所述候選專名的所有關聯系數進行計算;將結果滿足給定條件的所述候選專名作為專名,并按照專名對應的譯文進行翻譯。
與現有技術相比,本發明的說明性實施例包括以下優點:
通過構建專名映射表,對待譯文檔中的具有名詞性質的詞語在專名映射表中匹配進行專名分析,確定該詞語是否為專名,保證待譯文檔通過機器翻譯中名詞翻譯的準確性。
附圖說明
此處所說明的附圖用來提供對本發明的進一步理解,構成本申請的一部分,本發明的示意性實施例及其說明用于解釋本發明,并不構成對本發明的不當限定。在附圖中:
圖1是按照本發明的說明性實施例的流程圖。
具體實施方式
在以下詳細描述中,提出大量特定細節,以便于提供對本發明的透徹理解。但是,本領域的技術人員會理解,即使沒有這些特定細節也可實施本發明。在其它情況下,沒有詳細描述眾所周知的方法、過程、組件和電路,以免影響對本發明的理解。
為了更好的理解本發明中的說明性實施例,下面對本發明說明性實施例中的一些術語進行簡單說明。
本文中所使用的方法適用于多種語種,例如英文、中文、日文、法文等,本領域技術人員應該可以了解本文所公開的方法不僅僅適用于英文、中文、日文和法文,還可以是其他具有字詞結構的語種,在此不再窮舉。
機器翻譯引擎具有查找、索引、替換等功能,構成的自動翻譯技術,是基于各種語料數據庫作為基礎實現。
現在參照圖1,圖1示出了在一些說明性實施例中翻譯的流程圖。
如圖1所示,在一些說明性實施例中,公開了一種基于機器翻譯的專名翻譯方法,包括:
S11、對待譯文檔進行分詞處理,建立詞語集;
S12、將所述詞語集中的每個詞語在專名庫中進行匹配,將匹配成功的詞語作為候選專名;
S13、根據專名映射表,確定每個所述候選專名在所述待譯文檔中特定段落中具有的關聯項,以及每個關聯項的關聯系數;
S14、根據每個所述候選專名的所有關聯系數進行計算;
S15、將結果滿足給定條件的所述候選專名作為專名,并按照專名對應的譯文進行翻譯。
通過對待譯文檔中的具有名詞性質的詞語進行專名分析,確定該詞語是否為專名,保證待譯文檔通過機器翻譯中名詞翻譯的準確性。
在一些說明性實施例中,在對待譯文檔進行分詞處理之后,還包括:
去除獲取到的所有詞匯中的停用詞、形容詞、副詞、動詞,保留其中的名詞、成語和簡稱略語,并以保留的所述名詞、成語和簡稱略語建立所述候選詞匯庫。
在一些說明性實施例中,所述特定段落至少為候選專名在所述待譯文檔中的所在的句、所在的自然段和該候選專名在待譯文檔中前后一定范圍中之一。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于武漢傳神信息技術有限公司,未經武漢傳神信息技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201410406501.X/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:紙巾包
- 下一篇:銅纖維耐洗滌抗菌毛巾





