[發明專利]適用于機器學習的采集系統在審
| 申請號: | 201710860927.6 | 申請日: | 2017-09-21 |
| 公開(公告)號: | CN107562739A | 公開(公告)日: | 2018-01-09 |
| 發明(設計)人: | 曾傳德 | 申請(專利權)人: | 曾傳德 |
| 主分類號: | G06F17/28 | 分類號: | G06F17/28 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 610000 四川*** | 國省代碼: | 四川;51 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 適用于 機器 學習 采集 系統 | ||
1.適用于機器學習的采集系統,其特征在于,包括:
用于儲存翻譯原文和與翻譯原文對應的翻譯譯文的翻譯數據庫;
用于選取樣本原文的樣本選取模塊;
用于在翻譯數據庫中選取與樣本原文最相似的翻譯原文的對比模塊;
用于公開發布樣本原文和對比模塊選取出的與樣本原文最相似的翻譯原文的公開平臺;所述公開平臺還用于公開公開征集樣本原文對應的樣本譯文和翻譯原文對應的翻譯譯文;同一應征者必須完成一份樣本譯文和翻譯譯文;
所述對比模塊還用于將同一應征者完成的樣本譯文和翻譯譯文同時提取出來,并將翻譯譯文與翻譯數據庫中的翻譯譯文進行對比;如果應征者完成的翻譯譯文與翻譯數據庫中的翻譯譯文的相似度大于通過閾值,則對比模塊將該應征者完成的樣本譯文和原文樣本放入翻譯數據庫。
2.根據權利要求1所述的適用于機器學習的采集系統,其特征在于,所述對比模塊對比兩個句子是否相似時,解析兩個句子的句法樹,并得出兩個句子的句法樹之間的納真值TP,誤報值FP,去真值FN;所述對比模塊通過下式得出兩個句子的相似值:上文所述TP為納真值,FP為誤報值,FN為去真值,R為召回率,P為結構準確率,F為相似值。
3.根據權利要求1所述的適用于機器學習的采集系統,其特征在于,所述翻譯數據庫還用于對翻譯原文和與翻譯譯文進行機器學習。
4.根據權利要求1所述的適用于機器學習的采集系統,其特征在于,所述公開平臺還用于當應征者完成的翻譯譯文與翻譯數據庫中的翻譯譯文的相似度小于通過閾值,且大于封禁閾值,再次發送樣本原文和翻譯原文給該應征者。
5.根據權利要求4所述的適用于機器學習的采集系統,其特征在于,所述公開平臺還用于當應征者完成的翻譯譯文與翻譯數據庫中的翻譯譯文的相似度小于封禁閾值,將該應征者封禁。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于曾傳德,未經曾傳德許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710860927.6/1.html,轉載請聲明來源鉆瓜專利網。





