[發明專利]一種準確翻譯國際貿易合同的方法有效
| 申請號: | 201410405249.0 | 申請日: | 2014-08-18 |
| 公開(公告)號: | CN104239291B | 公開(公告)日: | 2017-06-06 |
| 發明(設計)人: | 江潮;張芃 | 申請(專利權)人: | 網來云商環球信息技術(武漢)有限公司 |
| 主分類號: | G06F17/28 | 分類號: | G06F17/28 |
| 代理公司: | 北京康盛知識產權代理有限公司11331 | 代理人: | 張宇峰 |
| 地址: | 430073 湖北省武漢市東湖新技術*** | 國省代碼: | 湖北;42 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 準確 翻譯 國際貿易 合同 方法 | ||
1.一種準確翻譯國際貿易合同的方法,其特征在于,包括:
建立關聯項映射表,具體包括:
提取國際貿易語料庫中包含有詞匯w的所有語句,構建第一語句集;
去除所述第一語句集中詞匯w未按照國際貿易合同中的詞義翻譯的所有語句,構建第二語句集;
對所述第一語句集中的每個語句進行分詞處理,保留名詞、動詞、形容詞、副詞、習語或縮略語,將得到的詞匯作為候選關聯詞匯,建立候選關聯詞匯集WCN={wcn1,wcn2,…,wcnl};
計算所述第二語句集在所述第一語句集中的語句占比P(w);
計算所述第一語句集中包含候選關聯詞匯wcni(1≤i≤l )的語句在第一語句集中的占比P(wcni);
計算第二語句集中包含候選關聯詞匯wcni的語句在第二語句集中的占比P(wcni|w)比;
根據P(w)、P(wcni)、P(wcni|w)計算出每個候選關聯詞匯的詞頻系數;
所述詞頻系數大于閾值的所述候選關聯詞匯作為關聯詞匯;
根據獲得的所述關聯詞匯,確定關聯項以及其關聯系數,建立所述關聯項映射表;
獲取待譯詞匯,以及所述待譯詞匯所在語句;
在國際貿易語料庫中查找所述待譯詞匯所在語句中具有的關聯項,以及每個所述關聯項的關聯系數;所述國際貿易語料庫中包含有所述關聯項映射表;其中,所述關聯項映射表中每個詞匯對應至少一個關聯項,每個關聯項具有關聯系數;所述在國際貿易語料庫中查找所述待譯詞匯所在語句中具有的關聯項,以及每個所述關聯項的關聯系數,具體包括:
通過在所述關聯項映射表中查找所述待譯詞匯所在語句中具有的所有關聯項,以及每個所述關聯項的關聯系數;
對所有所述關聯項的關聯系數進行計算,結果滿足給定條件時,將所述 待譯詞匯按照其在國際貿易合同中的詞義進行翻譯。
2.根據權利要求1所述的方法,其特征在于,計算出每個候選關聯詞匯的詞頻系數的過程,包括:
按照如下公式計算出所述詞頻系數;
3.根據權利要求1所述的方法,其特征在于,所述保留的名詞、動詞、形容詞、副詞、習語或縮略語中至少包含有如下之一:
時間、金額、古體語、情態動詞、定語從句和狀語從句。
4.根據權利要求1所述的方法,其特征在于,根據獲得的所述關聯詞匯,確定關聯項以及其關聯系數的過程,包括:
將每個關聯詞匯作為一個單項關聯項,每個單項關聯項的關聯系數為其詞頻系數;
將所有關聯詞匯中的每個唯一組合作為一個多項關聯項,每個所述多項關聯項的關聯系數通過公式:
遞推計算得到,其中,P(An|A1A2…An-1)為多項關聯項A1A2…An-1的關聯系數。
5.根據權利要求1所述的方法,其特征在于,對所有所述關聯項的關聯系數進行計算的過程,包括:
按照如下公式計算出所述待譯詞匯的權重P(spec):
P(spec)=∑i∈{1,2,…,n}Pi-∑i,j∈{1,2,…,n},i≠jPiPj+∑i,j,k∈{1,2,…,n},i≠j≠k PiPjPk-…+(-1)n+1P1P2…Pn;
其中,Pi、Pj和、Pk和Pn為關聯項的關聯系數;n為待譯詞匯關聯項的項數,i、j、k為關聯項的序號,1≤i、j、k≤n。
6.根據權利要求5所述的方法,其特征在于,所述給定條件至少包含 以下之一:
1)、P(spec)=1;
2)、P(spec)不小于預先設定的權重閾值;
3)、對于有m個關聯詞的詞匯w,P(spec)大于w的條件概率表中的條件概率數不少于2m-1。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于網來云商環球信息技術(武漢)有限公司,未經網來云商環球信息技術(武漢)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201410405249.0/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種保健艾餅
- 下一篇:一種自發光的按摩短褲





