[發明專利]面向通用機譯引擎的個性化翻譯方法及裝置在審
| 申請號: | 201310722090.0 | 申請日: | 2013-12-24 |
| 公開(公告)號: | CN104731774A | 公開(公告)日: | 2015-06-24 |
| 發明(設計)人: | 楊沐昀;朱俊國;趙鐵軍;李生;鄭德權;朱聰慧;曹海龍;徐冰 | 申請(專利權)人: | 哈爾濱工業大學 |
| 主分類號: | G06F17/28 | 分類號: | G06F17/28;G06F17/27 |
| 代理公司: | 北京康信知識產權代理有限責任公司 11240 | 代理人: | 吳貴明;張永明 |
| 地址: | 150001 黑龍*** | 國省代碼: | 黑龍江;23 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 面向 通用 引擎 個性化 翻譯 方法 裝置 | ||
1.一種面向通用機譯引擎的個性化翻譯方法,其特征在于,包括:
獲取用戶輸入的翻譯內容;
獲取所述翻譯內容的在線翻譯結果;
基于所述翻譯內容在雙語翻譯實例庫進行相似度檢索,獲取至少一個翻譯實例;
使用所述在線翻譯結果對所述翻譯實例進行增量式對齊,生成混淆網絡;
對所述混淆網絡進行解碼,獲取翻譯候選結果。
2.根據權利要求1所述的方法,其特征在于,在獲取用戶輸入的翻譯內容之前,所述方法還包括:
獲取所述雙語翻譯實例庫,所述雙語翻譯實例庫包括多組句對;
將所述雙語翻譯實例庫中沒有經過詞對齊的句對進行自動對齊處理,獲取詞對齊的雙語句對,其中,所述雙語句對包括:源語言和所述源語言對應的目標語言。
3.根據權利要求2所述的方法,其特征在于,基于所述翻譯內容在雙語翻譯實例庫進行相似度檢索,獲取至少一個翻譯實例的步驟包括:
獲取所述翻譯內容的向量值;
獲取所述雙語翻譯實例庫中所有翻譯實例的源語言向量值;
根據所述翻譯內容的向量值和所述雙語翻譯實例庫中所有翻譯實例的源語言向量值進行相似度計算,生成所述翻譯內容的多個相似度值;
按照所述相似度值,選擇所述翻譯內容對應的N個翻譯實例,N為自然數。
4.根據權利要求3所述的方法,其特征在于,根據所述翻譯內容的向量值和所述雙語翻譯實例庫中所有源語言的向量值進行相似度計算,生成所述翻譯內容的多個相似度值的步驟包括:
通過如下公式計算得到所述翻譯內容的相似度值P:
其中,所述ex_Fi是所述翻譯實例的源語言向量值,所述F是所述翻譯內容的向量值,所述ex_Fi·F是所述翻譯實例的源語言向量值和所述翻譯內容的向量值的內積,所述‖ex_F‖*‖F‖是所述翻譯實例的源語言向量值和所述翻譯內容的向量值的范數。
5.根據權利要求4所述的方法,其特征在于,按照所述相似度值,選擇所述翻譯內容對應的N個翻譯實例的步驟包括:
對所述翻譯內容的多個相似度值按照數值大小進行排序;
按照排序后的相似度值提取對應的翻譯實例,獲取所述N個翻譯實例。
6.根據權利要求1至5中任意一項所述的方法,其特征在于,使用所述在線翻譯結果對所述翻譯實例進行增量式對齊,生成混淆網絡的步驟包括:
設置所述在線翻譯結果為原始翻譯骨架;
依次將所述翻譯實例的目標語言與所述原始翻譯骨架進行增量式對齊處理,得到對齊結果;
根據所述對齊結果,將所述在線翻譯結果和所述N個翻譯實例中的譯文的全部詞匯連接構成所述混淆網絡。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于哈爾濱工業大學;,未經哈爾濱工業大學;許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201310722090.0/1.html,轉載請聲明來源鉆瓜專利網。





