[發明專利]譯員基因的選取方法、裝置與電子設備有效
| 申請號: | 201811095799.1 | 申請日: | 2018-09-19 |
| 公開(公告)號: | CN109299737B | 公開(公告)日: | 2021-10-26 |
| 發明(設計)人: | 張芃 | 申請(專利權)人: | 語聯網(武漢)信息技術有限公司 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62;G06Q10/06 |
| 代理公司: | 北京路浩知識產權代理有限公司 11002 | 代理人: | 王瑩;吳歡燕 |
| 地址: | 430000 湖北省武漢市東湖開發區光谷軟件*** | 國省代碼: | 湖北;42 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 譯員 基因 選取 方法 裝置 電子設備 | ||
本發明實施例提供一種譯員基因的選取方法、裝置與電子設備,該方法包括:從備選譯員基因列表中,分別選取多組不同的基因,構成多個譯員基因組;對于每一個譯員基因組,進行多次匹配結果采樣,獲取多個匹配成功率樣本,并據此計算該譯員基因組對應的匹配成功率的均值和標準差;基于所有譯員基因組分別對應的均值和每一個譯員基因組對應的標準差,計算該譯員基因組對應的Z值;基于每一個譯員基因組對應的Z值,選取滿足設定條件的譯員基因組,并將滿足設定條件的譯員基因組中的基因合并,獲取最終選取的譯員基因。本發明實施例能夠選取更有效的譯員基因組合與待翻譯稿件進行匹配,從而有效提高翻譯效率和翻譯準確率。
技術領域
本發明實施例涉及數據處理技術領域,更具體地,涉及一種譯員基因的選取方法、裝置與電子設備。
背景技術
信息時代和網絡化使翻譯工作方式發生了很大的變化。利用翻譯流程管理平臺,根據不同對象儲存人才資料,以根據待翻譯的稿件匹配出最適合的譯員。不同的譯員,其所包含的關鍵信息不盡相同,則根據這些關鍵信息,可以為譯員匹配最適合的翻譯稿件,從而有效提高翻譯效率和翻譯準確性。
譯員與稿件的基因匹配是指將稿件基因與譯員基因在既定策略下通過匹配模型,實現為稿件找到最佳譯員的過程。所選取的用于進行基因匹配的譯員基因與其它譯員基因相比,應該能夠更好的體現譯員的差異性,如此才能為待翻譯稿件匹配到更適合的譯員。
譯員基因主要指通過對譯員特征屬性進行分析計算、量化處理,所獲取到的存在于特定譯員的、區別于其他譯員的、獨一無二的關鍵信息組合。譯員基因的來源渠道很多,在社交時代,譯員的一舉一動的所有數據均可以提取出基因來。
譯員基因存在于管理平臺的所有譯員中,不同譯員具備不同的譯員基因。由于具體應用的不同,目前存在的譯員/文稿基因匹配算法在選擇譯員的待匹配基因進行匹配計算時,常根據經驗來選擇相應的基因組合。
但是,在譯員工作過程中,基因會隨著能力的提升、時間的增加、知識的積累而發生相應的變化。即隨著任務的處理、審校和QC的評價、歷史語料的積累、社區活動的參與以及譯員能力的測試等活動,譯員基因將不斷更新。因此,上述依據經驗的譯員基因選擇方式會存在一定的局限性,導致選擇出的譯員基因不能很好的體現譯員間的差異性。
發明內容
為了克服上述問題或者至少部分地解決上述問題,本發明實施例提供一種譯員基因的選取方法、裝置與電子設備,用以使得選取出的譯員基因能夠更好的體現譯員間的差異性。
第一方面,本發明實施例提供一種譯員基因的選取方法,包括:從備選譯員基因列表中,分別選取多組不同的基因,構成多個譯員基因組;對于每一個所述譯員基因組,進行多次匹配結果采樣,獲取多個匹配成功率樣本,并基于所述多個匹配成功率樣本,計算該譯員基因組對應的匹配成功率的均值和標準差;基于所有所述譯員基因組分別對應的所述均值和每一個所述譯員基因組對應的所述標準差,計算該譯員基因組對應的Z值;基于每一個所述譯員基因組對應的所述Z值,從所有所述譯員基因組中選取滿足設定條件的譯員基因組,并將所述滿足設定條件的譯員基因組中的基因合并,獲取最終選取的譯員基因;其中,所述Z值表示大樣本差異性驗證中Z值。
第二方面,本發明實施例提供一種譯員基因的選取裝置,包括:初始基因選取模塊,用于從備選譯員基因列表中,分別選取多組不同的基因,構成多個譯員基因組;第一計算模塊,用于對于每一個所述譯員基因組,進行多次匹配結果采樣,獲取多個匹配成功率樣本,并基于所述多個匹配成功率樣本,計算該譯員基因組對應的匹配成功率的均值和標準差;第二計算模塊,用于基于所有所述譯員基因組分別對應的所述均值和每一個所述譯員基因組對應的所述標準差,計算該譯員基因組對應的Z值;最終基因選取模塊,用于基于每一個所述譯員基因組對應的所述Z值,從所有所述譯員基因組中選取滿足設定條件的譯員基因組,并將所述滿足設定條件的譯員基因組中的基因合并,獲取最終選取的譯員基因;其中,所述Z值表示大樣本差異性驗證中Z值。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于語聯網(武漢)信息技術有限公司,未經語聯網(武漢)信息技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811095799.1/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:產品批次混合度計算裝置及方法
- 下一篇:稿件基因的選取方法、裝置與電子設備





