[發(fā)明專利]一種翻譯項目的風險評估方法及系統(tǒng)在審
| 申請?zhí)枺?/td> | 201611243229.3 | 申請日: | 2016-12-29 |
| 公開(公告)號: | CN106779455A | 公開(公告)日: | 2017-05-31 |
| 發(fā)明(設計)人: | 張芃;陳鈺清 | 申請(專利權)人: | 語聯(lián)網(武漢)信息技術有限公司 |
| 主分類號: | G06Q10/06 | 分類號: | G06Q10/06;G06F17/27;G06F17/28 |
| 代理公司: | 北京康盛知識產權代理有限公司11331 | 代理人: | 宋卉 |
| 地址: | 430000 湖北省武漢市東湖*** | 國省代碼: | 湖北;42 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 翻譯 項目 風險 評估 方法 系統(tǒng) | ||
技術領域
本發(fā)明涉及翻譯技術領域,特別是涉及一種翻譯項目的風險評估方法及系統(tǒng)。
背景技術
在全球化、國際化的今天,世界政治、經濟、文化的交流越來越頻繁,各國人員的往來也越來越密集,使得對翻譯的需求也越來越大;同時,隨著互聯(lián)網的興起,翻譯服務業(yè)正向著大規(guī)模產業(yè)化的方向發(fā)展,平臺化處理翻譯項目也逐步成為主流處理方式,平臺化處理可將之前線下處理方式搬到線上,讓譯員能夠在線翻譯,實時提交翻譯成果,項目管理員也可在線監(jiān)控項目完成情況,并以人工方式識別風險,實時調度資源分配,以保證項目按時,按質提交。
由于翻譯平臺存在著大量待處理的翻譯項目,因此翻譯平臺化的最大風險在于不能科學、合理的識別翻譯項目的潛在風險項目,使得部分翻譯項目被錯誤評估其實際的風險,進而導致翻譯項目延誤、錯譯等問題的出現。
發(fā)明內容
本發(fā)明公開了一種翻譯項目的風險評估方法及系統(tǒng),旨在提高翻譯項目識別的準確性。為了對披露的實施例的一些方面有一個基本的理解,下面給出了簡單的概括。該概括部分不是泛泛評述,也不是要確定關鍵/重要組成元素或描繪這些實施例的保護范圍。其唯一目的是用簡單的形式呈現一些概念,以此作為后面的詳細說明的序言。
根據本發(fā)明的第一個方面,提供了根據本發(fā)明的第一個方面,提供了一種翻譯項目的風險評估方法,包括:獲取翻譯項目的翻譯要求;從翻譯項目中提取文檔樣本;確定文檔樣本的翻譯難度;根據文檔樣本的翻譯難度,確定翻譯項目未達到翻譯要求的風險。
進一步的,確定文檔樣本的翻譯難度,包括:確定文檔樣本的詞匯復雜度和語句復雜度;根據詞匯復雜度和語句復雜度,確定文檔樣本的翻譯難度,翻譯難度按如下計算公式得到:
diff_doc=K1·diff_word+K2·diff_sentence;
其中,diff_doc為翻譯難度,diff_word為詞匯復雜度,diff_sentence為語句復雜度,K1、K2為文檔樣本的翻譯難度調節(jié)系數。
進一步的,確定文檔樣本的詞匯復雜度,包括:提取文檔樣本的所有詞匯,確定文檔樣本的詞匯等級grade_word、類符形符比STTR和實義詞密度density_notional;確定文檔樣本的詞匯復雜度,詞匯復雜度按如下計算公式得到:
diff_word=K11·grade_word+K12·STTR+K13·density_notional,
其中,diff_word為詞匯復雜度,K11、K12、K13為文檔樣本的詞匯復雜度調節(jié)系數。
進一步的,確定文檔樣本的詞匯等級grade_word,包括:將所有詞匯與其所屬語種的詞匯分級表進行匹配,得到所有詞匯的等級,等級至少包括一級、二級、三級和四級,其中,未匹配在一級、二級或三級級別中的詞匯為四級;統(tǒng)計二級和二級以上的詞匯所占的詞匯比率,確定文檔樣本的詞匯等級grade_word,詞匯等級grade_word按如下計算公式得到:
其中,word2、word3和word4分別為二級、三級和四級的詞匯數量,word為文檔樣本的總詞匯數量,K111、K112、K113為文檔樣本的詞匯等級調節(jié)系數。
進一步的,確定文檔樣本的類符形符比STTR,包括:統(tǒng)計文檔樣本的形符和類符,形符為文檔的總詞匯數量,類符為文檔的不相同的詞匯數量,若形符不足標準數量,則計算類符與形符之比,得到類符形符比;若形符大于等于標準數量,則將文檔樣本劃分為若干個含標準數量個詞匯的子文檔和1個不足標準數量的子文檔;按照類符形符比計算公式,計算得到的類符形符比STTR,類符形符比STTR按如下計算公式得到:
其中,token為不足標準數量的子文檔的形符數,type為不足標準數量子文檔的類符數,n為含標準數量個詞匯的子文檔的數量,typei為n子文檔中第i個子文檔的類符數,ST為標準數量的表示值。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于語聯(lián)網(武漢)信息技術有限公司,未經語聯(lián)網(武漢)信息技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201611243229.3/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種健身器材管理方法及裝置
- 下一篇:一種能源分配控制方法及裝置
- 同類專利
- 專利分類
G06Q 專門適用于行政、商業(yè)、金融、管理、監(jiān)督或預測目的的數據處理系統(tǒng)或方法;其他類目不包含的專門適用于行政、商業(yè)、金融、管理、監(jiān)督或預測目的的處理系統(tǒng)或方法
G06Q10-00 行政;管理
G06Q10-02 .預定,例如用于門票、服務或事件的
G06Q10-04 .預測或優(yōu)化,例如線性規(guī)劃、“旅行商問題”或“下料問題”
G06Q10-06 .資源、工作流、人員或項目管理,例如組織、規(guī)劃、調度或分配時間、人員或機器資源;企業(yè)規(guī)劃;組織模型
G06Q10-08 .物流,例如倉儲、裝貨、配送或運輸;存貨或庫存管理,例如訂貨、采購或平衡訂單
G06Q10-10 .辦公自動化,例如電子郵件或群件的計算機輔助管理





