日韩在线一区二区三区,日本午夜一区二区三区,国产伦精品一区二区三区四区视频,欧美日韩在线观看视频一区二区三区 ,一区二区视频在线,国产精品18久久久久久首页狼,日本天堂在线观看视频,综合av一区

[發明專利]文本分類模型的更新方法及系統、電子設備及存儲介質在審

專利信息
申請號: 202010626363.1 申請日: 2020-07-01
公開(公告)號: CN111737472A 公開(公告)日: 2020-10-02
發明(設計)人: 鄧艷江;羅超;胡泓 申請(專利權)人: 攜程計算機技術(上海)有限公司
主分類號: G06F16/35 分類號: G06F16/35;G06F16/958;G06F16/23
代理公司: 上海弼興律師事務所 31283 代理人: 薛琦;張冉
地址: 200335 上海市*** 國省代碼: 上海;31
權利要求書: 查看更多 說明書: 查看更多
摘要:
搜索關鍵詞: 文本 分類 模型 更新 方法 系統 電子設備 存儲 介質
【說明書】:

發明公開了一種文本分類模型的更新方法及系統、電子設備及存儲介質。所述文本分類模型的更新方法包括:利用目標文本分類模型對網頁文本進行分類,并將分類結果展示于前端頁面;若接收到用戶對所述分類結果執行的質疑操作,則將所述網頁文本以及對所述網頁文本進行人工標注的分類結果作為新增樣本;將包括原有訓練集和所述新增樣本的數據集劃分為訓練集、測試集和驗證集,重新訓練文本分類模型;根據文本分類模型在訓練集、測試集以及驗證集上的F1值篩選最佳模型,并將所述目標文本分類模型更新為所述最佳模型。本發明實現了對誤判樣本的收集,并據此來重新訓練更準確的文本分類模型,從而替換原有的文本分類模型,提高了用戶體驗。

技術領域

本發明涉及信息技術領域,特別涉及一種文本分類模型的更新方法及系統、電子設備及存儲介質。

背景技術

隨著人工智能技術的發展,很多原來由人工完成的工作現在逐步被模型所替代,例如投訴分析系統、細粒度情感分析系統等。訓練集有標注錯誤或者訓練集樣本不全等原因可能導致模型上線后有一些誤判的樣本。如果能不斷地收集、甄別并利用這部分樣本,讓模型進一步學習,模型的準確率和召回率也會不斷地提高。但是,當前缺乏一套流程化、規范化的系統以高效完成以上工作。

發明內容

本發明要解決的技術問題是為了克服現有技術中的上述缺陷,提供一種文本分類模型的更新方法及系統、電子設備及存儲介質。

本發明是通過下述技術方案來解決上述技術問題:

本發明的第一方面提供一種文本分類模型的更新方法,包括:

利用目標文本分類模型對網頁文本進行分類,并將分類結果展示于前端頁面;

若接收到用戶對所述分類結果執行的質疑操作,則將所述網頁文本以及對所述網頁文本進行人工標注的分類結果作為新增樣本;

將包括原有訓練集和所述新增樣本的數據集劃分為訓練集、測試集和驗證集,重新訓練文本分類模型;其中,所述原有訓練集為訓練所述目標文本分類模型所使用的訓練集;

根據文本分類模型在訓練集、測試集以及驗證集上的F1值篩選最佳模型,并將所述目標文本分類模型更新為所述最佳模型。

較佳地,所述根據文本分類模型在訓練集、測試集以及驗證集上的F1值篩選最佳模型,具體包括:

根據文本分類模型在訓練集和驗證集上的F1值的平均值以及方差篩選備選模型;

根據更新前的目標文本分類模型與所述備選模型分別在測試集上的F1值確定是否將所述備選模型作為最佳模型。

較佳地,所述根據文本分類模型在訓練集和驗證集上的F1值的平均值以及方差篩選備選模型,具體包括:

利用以下公式計算文本分類模型的分數Score:

Score=a*F1平均值-(1-a)*F1方差;

其中,F1平均值為文本分類模型在訓練集和驗證集上的F1值的平均值,F1方差為文本分類模型在訓練集和驗證集上的F1值的方差,a為權重;

篩選分數Score最大的文本分類模型作為備選模型。

較佳地,所述根據更新前的目標文本分類模型與所述備選模型分別在測試集上的F1值確定是否將所述備選模型作為最佳模型,具體包括:

若更新前的目標文本分類模型在測試集上的F1值與所述備選模型在測試集上的F1值之間的差值不大于1%,則確定將所述備選模型作為最佳模型。

較佳地,所述更新方法還包括:

下載完整專利技術內容需要扣除積分,VIP會員可以免費下載。

該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于攜程計算機技術(上海)有限公司,未經攜程計算機技術(上海)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服

本文鏈接:http://www.szxzyx.cn/pat/books/202010626363.1/2.html,轉載請聲明來源鉆瓜專利網。

×

專利文獻下載

說明:

1、專利原文基于中國國家知識產權局專利說明書;

2、支持發明專利 、實用新型專利、外觀設計專利(升級中);

3、專利數據每周兩次同步更新,支持Adobe PDF格式;

4、內容包括專利技術的結構示意圖、流程工藝圖技術構造圖;

5、已全新升級為極速版,下載速度顯著提升!歡迎使用!

請您登陸后,進行下載,點擊【登陸】 【注冊】

關于我們 尋求報道 投稿須知 廣告合作 版權聲明 網站地圖 友情鏈接 企業標識 聯系我們

鉆瓜專利網在線咨詢

周一至周五 9:00-18:00

咨詢在線客服咨詢在線客服
tel code back_top
主站蜘蛛池模板: 人人澡超碰碰97碰碰碰| 亚洲一二三在线| 护士xxxx18一19| 欧美一区二区三区激情在线视频| 国产91视频一区| 97人人模人人爽人人喊38tv| 精品久久久综合| 色婷婷精品久久二区二区6| 亚洲国产精品入口| 国产一区二区三区在线电影| 精品久久9999| 欧美一区二区三区久久久久久桃花 | 韩国女主播一区二区| 亚洲高清乱码午夜电影网| 国产精品欧美一区二区视频| 国产精品亚洲精品| 国产精品综合一区二区三区| 久久精品综合视频| 精品久久久久久中文字幕大豆网 | 午夜裸体性播放免费观看| 色噜噜狠狠色综合影视| 久久国产精品二区| 在线精品一区二区| 福利片一区二区三区| 一区二区三区国产视频| 91麻豆精品一区二区三区| 欧美日韩精品影院| 日韩午夜三级| 国产电影精品一区| 欧美一区二区性放荡片| av午夜影院| 国产乱码一区二区三区| 国产丝袜在线精品丝袜91| 日本美女视频一区二区| 护士xxxx18一19| 99热久久这里只精品国产www| 国产综合久久精品| 狠狠色狠狠色综合系列| 99精品国产99久久久久久97| 国产1区2区视频| 99久久免费毛片基地| 日韩欧美国产第一页| 精品国产一区二区三区麻豆免费观看完整版 | 欧美日韩精品不卡一区二区三区| 国产69精品久久777的优势| 波多野结衣女教师电影| xoxoxo亚洲国产精品| 国产男女乱淫真高清视频免费| 国产精品久久人人做人人爽| 国产免费一区二区三区四区五区| 欧美日韩国产色综合一二三四| 午夜精品一二三区| 国产经典一区二区| 三级视频一区| 亚洲福利视频一区| 日本一区二区在线观看视频| 国产精品一区二区av日韩在线| 26uuu亚洲国产精品| 国产老妇av| 偷拍自中文字av在线| 中文乱码在线视频| 久久久久久中文字幕| 亚洲午夜国产一区99re久久| 午夜情所理论片| 欧美日韩中文字幕三区| 久久国产精品波多野结衣| 亚洲国产精品肉丝袜久久| 国产精品电影一区二区三区| 欧美色图视频一区| 日韩有码一区二区三区| 99爱精品在线| 91麻豆精品国产91久久久久| 欧美日韩国产精品一区二区| 久久国产精品视频一区| 91精品视频一区二区三区| 国产精品一区不卡| 久久国产欧美一区二区三区精品| 亚洲午夜精品一区二区三区电影院| 欧美乱战大交xxxxx| 99精品久久99久久久久| 亚洲精品卡一卡二 | 久久国产精品首页|