[發明專利]一種語句翻譯復雜度的分析方法有效
| 申請號: | 201310712248.6 | 申請日: | 2013-12-23 |
| 公開(公告)號: | CN103729348A | 公開(公告)日: | 2014-04-16 |
| 發明(設計)人: | 江潮 | 申請(專利權)人: | 武漢傳神信息技術有限公司 |
| 主分類號: | G06F17/28 | 分類號: | G06F17/28;G06Q10/06 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 430073 湖北省武漢市東湖開發區光谷軟件*** | 國省代碼: | 湖北;42 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 語句 翻譯 復雜度 分析 方法 | ||
1.一種語句翻譯復雜度的分析方法,其特征在于,包括:
掃描待譯語句,對所述待譯語句進行分詞處理,得到所述待譯語句中的所有詞匯,并統計出詞匯總數;
根據得到的所述待譯語句中的所有詞匯,并統計出詞匯總數,確定所述待譯語句中的的句長、所述待譯語句中的子句的數量、子句的平均長度、所述待譯語句中的詞匯等級、所述待譯語句中的實義詞密度和所述待譯語句中的習語數;
根據所述待譯語句的句長、子句的平均長度、詞匯等級、實義詞密度和習語數建立計算翻譯復雜度的多元線性回歸模型,通過樣本數據得到回歸系數,從而得到所述語句的翻譯復雜度。
2.根據權利要求1所述的方法,其特征在于,所述待譯語句中的句長為所述待譯語句所述詞匯總數。
3.根據權利要求2所述的方法,其特征在于,確定所述待譯語句中的子句的平均長度的過程包括:
將所述待譯語句中的所述詞匯總數除以所述子句數量,結果作為所述子句的平均長度。
4.根據權利要求1所述的方法,其特征在于,確定所述待譯語句的詞匯等級的過程包括:
將得到的每個所述詞匯在詞匯分級表中進行匹配,得到每個所述詞匯的詞匯級別;所述詞匯級別為一級、二級、三級或四級;
分別統計所述詞匯級別為二級或二級以上的級別的所述詞匯的數量;
按照詞匯等級計算公式計算出所述語句的詞匯等級,所述詞匯等級計算公式如下:
其中,wordx為詞匯級別為X級的詞匯的數量,K111、K112和K113為詞匯等級調節系數,word為總詞匯數。
5.根據權利要求4所述的方法,其特征在于,所述詞匯等級調節系數為所述多元線性回歸模型的回歸系數,采用最小二乘法對樣本數據進行計算得到。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于武漢傳神信息技術有限公司,未經武漢傳神信息技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201310712248.6/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:具有推桿的采礦刨機
- 下一篇:關于雙梯度鉆井的井監測、感測、控制和泥漿測井





