[發明專利]計算機翻譯數據處理方法、系統及終端有效

申請號：	201210459144.4	申請日：	2012-11-14
公開（公告）號：	CN103810159A	公開（公告）日：	2014-05-21
發明（設計）人：	廖劍;盧小康;吳克文;張永剛;鄭文彬;林鋒	申請（專利權）人：	阿里巴巴集團控股有限公司
主分類號：	G06F17/28	分類號：	G06F17/28;G06F17/30
代理公司：	北京潤澤恒知識產權代理有限公司 11319	代理人：	蘇培華
地址：	英屬開曼群島大開***	國省代碼：	開曼群島;KY
權利要求書：	查看更多	說明書：	查看更多
摘要：
搜索關鍵詞：	計算機翻譯數據處理方法系統終端
鉆瓜網技術展會專利詞庫專利權人專利榜在售專利公布日期熱門專利

【說明書】：

技術領域

本申請涉及計算機輔助翻譯技術領域，特別是涉及一種計算機翻譯數據處理方法、系統及終端。

背景技術

隨著科學技術和互聯網的快速發展，計算機和網絡技術己經深入我們工作、生活的方方面面。在翻譯領域，也出現了計算機輔助翻譯技術，例如常見的google翻譯、百度翻譯或有道翻譯等等。

計算機輔助翻譯常見的方法有根據語料庫實現記憶翻譯，即將待翻譯的句子分解為幾個詞語，然后借助于已經存儲的實例翻譯，對分解出來的詞語進行翻譯，最后再將翻譯后的結果組合起來。例如，需要翻譯的句子為“他買了一本書”，則可以分解為“他、買了、一本書”，然后在系統中進行查找對應的翻譯實例，例如，查找到“她正在看一本書：she?is?reading?a?book”以及“他買了一臺電腦：he?bought?a?computer”，那么就可以對分解出來的詞或短語進行翻譯得到“he、bought、a?book”，最后組合得到翻譯結果“he?bought?a?book”。

此種方式可以將句子細分到很小的顆粒，從而可以提高翻譯質量。但是因為需要精確的匹配操作，為了保證匹配率，需要在系統中或數據庫中維護大量的實例語句數據，這就會占用大量的數據存儲空間。同時，在大量的實例語句數據中查詢匹配完全相同的詞語也需要花費較多的查詢時間，從而導致系統的響應速度較慢。當待翻譯句子的并發量較大時，還可能會導致系統崩潰。另外，因為較為單一的翻譯方式還可能影響翻譯結果的準確性，，此時往往需要人為的修改待翻譯的句子反復查詢，直到得到用戶期望的結果，這無疑會增加系統的負載。

發明內容

本申請提供一種計算機翻譯數據處理方法、系統及終端，能夠解決翻譯查詢效率低，系統響應慢的問題。

為了解決上述問題，本申請公開了一種計算機翻譯數據處理方法，包括以下步驟：

獲取至少兩個翻譯模塊輸出的翻譯結果；

確定所述翻譯模塊的加權權重值；

計算所述翻譯結果的基礎分值；

基于所述翻譯結果的基礎分值和對應的翻譯模塊的加權權重值計算所述翻譯結果的最終分值；

根據所述翻譯結果的最終分值選取部分或全部的翻譯結果輸出。

進一步地，所述至少兩個翻譯模塊具有不同的翻譯規則，所述翻譯結果為所述至少兩個翻譯模塊用各自的翻譯規則對同一待翻譯的源語句進行翻譯后得到的翻譯結果。

進一步地，所述確定所述翻譯模塊的加權權重值包括：

將訓練樣本輸入各翻譯模塊得到輸出結果；

對輸出結果進行評分，得到輸出結果的分值；