[發明專利]一種可預測交互翻譯方法有效
| 申請號: | 201611264585.3 | 申請日: | 2016-12-30 |
| 公開(公告)號: | CN106844353B | 公開(公告)日: | 2020-05-08 |
| 發明(設計)人: | 陶晶 | 申請(專利權)人: | 語聯網(武漢)信息技術有限公司 |
| 主分類號: | G06F40/284 | 分類號: | G06F40/284;G06F40/58 |
| 代理公司: | 江蘇法德東恒律師事務所 32305 | 代理人: | 劉林 |
| 地址: | 430073 湖北省武漢市東湖*** | 國省代碼: | 湖北;42 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 預測 交互 翻譯 方法 | ||
本發明公開了一種可預測交互翻譯方法,其特征是包括如下步驟:獲取已有譯文,對已有譯文和用戶譯文進行分詞、詞性分析、依存句法分析,得到已有譯文詞序列,用戶譯文詞序列,倒序遍歷用戶詞序列中的詞,與已有譯文詞序列進行匹配,若匹配結果大于1,則從已有譯文中推薦詞性相同的詞的依存關聯關系詞;若匹配結果等于1,則從已有譯文中推薦匹配結果的向后的依存關聯關系詞,直到倒序遍歷結束;若匹配結果等于0,則分別分析用戶譯文詞序列的詞性序列,及已有譯文詞序列的詞性序列,進行匹配,獲取匹配結果,推薦匹配結果的后續詞;優點是:能夠根據用戶輸入預測后續詞,便于提高翻譯人員的工作效率,使全文翻譯質量得到提高。
技術領域
本發明涉及自然語言處理領域,尤其涉及一種可預測交互翻譯方法。
背景技術
人工智能、機器學習領域的迅速發展,使機器翻譯技術迅速成長,以google,bing,baidu,有道等互聯網公司提供機器翻譯,降低了我們翻譯的成本。以機器翻譯為草稿,人工在此基本上進行修改,從而得出完全正確的譯文,已經在翻譯工作中大幅應用。PE(Post-editing)即是一種輔助翻譯策略,得出機器翻譯譯文,在此基礎上修改;另外還有一種方式叫IMT(interactive-predictive machine translation ),這是根據譯員輸入詞預測提示的方示與機器翻譯進行互動,從而使全文翻譯質量更好良好。目前的機器翻譯方法,存在著推薦效率低,重復詞、陌生詞翻譯難的問題。
發明內容
本發明所要解決的技術問題是根據用戶輸入詞推薦更好質量的后續詞語,并使用詞性匹配,解決陌生詞,重復詞的問題;從而使全文翻譯質量得到提高。
為解決上述技術問題,本發明提供了一種可預測交互翻譯方法,其特征是包括如下步驟:
獲取已有譯文,對已有譯文進行預處理,得到已有譯文詞序列,
所述對已有譯文進行預處理包括分詞、詞性分析、依存句法分析,
所述已有譯文詞序列的元素結構包括順序、id、詞匯、詞性、依存關聯關系詞的id、依存關系;
輸入用戶譯文,對用戶譯文進行預處理,得到用戶譯文詞序列,
所述對用戶譯文進行預處理包括分詞、詞性分析、依存句法分析,
所述用戶譯文詞序列的元素結構包括順序、id、詞匯、詞性、依存關聯關系詞的id、依存關系;
倒序遍歷用戶詞序列中的詞,與已有譯文詞序列進行匹配,
獲取匹配結果,根據匹配結果推薦依存關聯關系詞或后續詞,其中,
若匹配結果大于1,則從已有譯文中推薦詞性相同的詞的依存關聯關系詞,
若匹配結果等于1,則從已有譯文中推薦匹配結果的向后的依存關聯關系詞,
直到倒序遍歷結束,若匹配結果等于0,則分別分析用戶譯文詞序列的詞性序列,及已有譯文詞序列的詞性序列,進行匹配,獲取匹配結果,推薦匹配結果的后續詞。
進一步,所述已有譯文是通過機器翻譯獲取到的譯文。
進一步,所述依存句法分析是通過開源的依存句法分析工具進行。
采用上述技術方案,可達到以下效果:根據用戶輸入詞推薦更好質量的后續詞語,并使用詞性匹配,解決陌生詞,重復詞的問題;能夠提高翻譯人員的工作效率,使全文翻譯質量得到提高。
附圖說明
此處所說明的附圖用來提供對本發明的進一步理解,構成本申請的一部分,本發明的示意性實施例及其說明用于解釋本發明,并不構成對本發明的不當限定。在附圖中:
圖1示出了本發明的示意圖。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于語聯網(武漢)信息技術有限公司,未經語聯網(武漢)信息技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201611264585.3/2.html,轉載請聲明來源鉆瓜專利網。





