日韩在线一区二区三区,日本午夜一区二区三区,国产伦精品一区二区三区四区视频,欧美日韩在线观看视频一区二区三区 ,一区二区视频在线,国产精品18久久久久久首页狼,日本天堂在线观看视频,综合av一区

[發(fā)明專利]一種基于主動學(xué)習(xí)的文本數(shù)據(jù)自動標(biāo)注方法有效

專利信息
申請?zhí)枺?/td> 201710081921.9 申請日: 2017-02-15
公開(公告)號: CN107067025B 公開(公告)日: 2020-12-22
發(fā)明(設(shè)計(jì))人: 王進(jìn);張登峰;卜亞楠;李穎;范磊;李智星;歐陽衛(wèi)華;孫開偉;陳喬松;鄧欣;胡峰;雷大江 申請(專利權(quán))人: 重慶郵電大學(xué)
主分類號: G06K9/62 分類號: G06K9/62
代理公司: 重慶市恒信知識產(chǎn)權(quán)代理有限公司 50102 代理人: 劉小紅
地址: 400065 重*** 國省代碼: 重慶;50
權(quán)利要求書: 查看更多 說明書: 查看更多
摘要:
搜索關(guān)鍵詞: 一種 基于 主動 學(xué)習(xí) 文本 數(shù)據(jù) 自動 標(biāo)注 方法
【說明書】:

發(fā)明請求保護(hù)一種基于主動學(xué)習(xí)的文本數(shù)據(jù)自動標(biāo)注方法,屬于主動學(xué)習(xí)領(lǐng)域,包括以下步驟:101對已標(biāo)記和未標(biāo)記數(shù)據(jù)進(jìn)行處理;102利用多個不同分類器對未標(biāo)記數(shù)據(jù)進(jìn)行分類;103選出分歧熵低的數(shù)據(jù);104對分歧熵低的數(shù)據(jù)進(jìn)行人工標(biāo)記;105對人工標(biāo)記結(jié)果進(jìn)行自檢。本發(fā)明針對如何在減少人工標(biāo)注數(shù)據(jù)的數(shù)量的同時,盡量保證人工標(biāo)注數(shù)據(jù)的準(zhǔn)確性問題,通過結(jié)合主動學(xué)習(xí)方法發(fā)明一個附帶自檢功能的數(shù)據(jù)自動標(biāo)注系統(tǒng),達(dá)到縮減工作量且提高人工標(biāo)注數(shù)據(jù)準(zhǔn)確性的目的。

技術(shù)領(lǐng)域

本發(fā)明涉及主動學(xué)習(xí)領(lǐng)域,尤其涉及一種基于主動學(xué)習(xí)的數(shù)據(jù)自動標(biāo)注方法。

背景技術(shù)

隨著大數(shù)據(jù)時代的到來,互聯(lián)網(wǎng)上出現(xiàn)了一種新型職業(yè)—數(shù)據(jù)標(biāo)注員。數(shù)據(jù)標(biāo)注員的工作是使用自動化的工具從互聯(lián)網(wǎng)上抓取、收集數(shù)據(jù),包括文本、圖片、語音等等,然后對抓取的數(shù)據(jù)進(jìn)行整理與標(biāo)注。具體的工作流程:首先,標(biāo)注人員經(jīng)過培訓(xùn),確定需要標(biāo)注的樣本數(shù)據(jù)以及標(biāo)注規(guī)則;然后,根據(jù)事先安排好的規(guī)則對樣本數(shù)據(jù)進(jìn)行打標(biāo);最后,對標(biāo)注完以后的結(jié)果進(jìn)行合并。但是,這種打標(biāo)過程存在以下問題:1、整個標(biāo)注過程非常復(fù)雜,數(shù)據(jù)量特別多的時候,需要人工勞動力會特別大;2、在數(shù)據(jù)標(biāo)注過程中,由于標(biāo)注人員的精力有限或者標(biāo)注人員的主觀性等因素,導(dǎo)致無法保證標(biāo)注數(shù)據(jù)的百分百準(zhǔn)確性,即無法判斷標(biāo)注的質(zhì)量。因此,大量數(shù)據(jù)的標(biāo)注過程是一個非常耗時且難以保證準(zhǔn)確率的任務(wù)。

在真實(shí)的應(yīng)用中,實(shí)驗(yàn)數(shù)據(jù)容易獲得,數(shù)據(jù)規(guī)模也是非常大的,由于數(shù)據(jù)需要處理成有標(biāo)簽樣本,因而,需要大量的人員耗時耗力來處理。在大數(shù)據(jù)發(fā)展的今天,通過已標(biāo)記樣本來標(biāo)記未標(biāo)記的樣本數(shù)據(jù)是非常常見的一種方法。由于人工標(biāo)記樣本是有限的,而且不能保證所有的人工標(biāo)記的數(shù)據(jù)樣本都是正確的。而且,在實(shí)際問題中,某些樣本數(shù)據(jù),如基因分析所用的基因組成數(shù)據(jù),標(biāo)記代價很高,所以通常來說,未標(biāo)記樣本數(shù)量會遠(yuǎn)遠(yuǎn)超過已標(biāo)記樣本的數(shù)據(jù)。因此,怎樣減少人工標(biāo)注數(shù)據(jù)的數(shù)量,并盡量保證人工標(biāo)注數(shù)據(jù)的準(zhǔn)確性的此類主動學(xué)習(xí)方法,成為了近年來的研究熱點(diǎn)之一。

因此,本文針對在大數(shù)據(jù)背景下,基于傳統(tǒng)主動學(xué)習(xí)方法,提出一種基于主動學(xué)習(xí)的數(shù)據(jù)自動標(biāo)注系統(tǒng),解決人工標(biāo)注數(shù)據(jù)的可靠性問題,對于機(jī)器學(xué)習(xí)算法不能正確標(biāo)注的數(shù)據(jù)樣本進(jìn)行人工標(biāo)注,之后,對人工標(biāo)注的結(jié)果利用一種自檢機(jī)制,對人工標(biāo)注結(jié)果進(jìn)行反饋,以確保數(shù)據(jù)標(biāo)注的正確性。

發(fā)明內(nèi)容

本發(fā)明旨在解決以上現(xiàn)有技術(shù)的問題。提出了一種縮減工作量且提高人工標(biāo)注數(shù)據(jù)準(zhǔn)確性的基于主動學(xué)習(xí)的文本數(shù)據(jù)自動標(biāo)注方法。本發(fā)明的技術(shù)方案如下:

一種基于主動學(xué)習(xí)的文本數(shù)據(jù)自動標(biāo)注方法,其包括以下步驟:101、對已標(biāo)記文本數(shù)據(jù)和未標(biāo)記文本數(shù)據(jù)進(jìn)行處理:首先分別對已人工標(biāo)記樣本文本數(shù)據(jù)和未標(biāo)記樣本文本數(shù)據(jù)做聚類處理,保存聚類后所得的k個聚簇中心點(diǎn) (C1,C2,C3,…,Ck)和每個聚簇內(nèi)點(diǎn)到聚類中心的距離d,以及每個聚簇的聚類半徑(r1,r2,…,rk);

102、利用多個不同的基分類器對未標(biāo)記文本數(shù)據(jù)進(jìn)行分類:根據(jù)步驟101 中經(jīng)過聚類處理的部分已標(biāo)記文本數(shù)據(jù)訓(xùn)練M個不同的分類器 (M1,M2,…,MM),并根據(jù)另外一部分文本數(shù)據(jù)使用線性回歸模型對M個不同基分類器的分類結(jié)果做模型融合,得到每個基分類器的權(quán)重(i1,i2,…,iM),使用這 M個分類器結(jié)合各自權(quán)重對未標(biāo)記文本數(shù)據(jù)進(jìn)行分類并根據(jù)標(biāo)記結(jié)果,將已確定標(biāo)記無誤的樣本加入已標(biāo)記樣本并不斷定時重新訓(xùn)練當(dāng)前各分類器模型,未標(biāo)記文本數(shù)據(jù)確認(rèn)類別后加入到已標(biāo)記文本數(shù)據(jù)中,隨著已標(biāo)記文本數(shù)據(jù)量的增加,分類器模型應(yīng)不斷重新訓(xùn)練更新;

下載完整專利技術(shù)內(nèi)容需要扣除積分,VIP會員可以免費(fèi)下載。

該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于重慶郵電大學(xué),未經(jīng)重慶郵電大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服

本文鏈接:http://www.szxzyx.cn/pat/books/201710081921.9/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。

×

專利文獻(xiàn)下載

說明:

1、專利原文基于中國國家知識產(chǎn)權(quán)局專利說明書;

2、支持發(fā)明專利 、實(shí)用新型專利、外觀設(shè)計(jì)專利(升級中);

3、專利數(shù)據(jù)每周兩次同步更新,支持Adobe PDF格式;

4、內(nèi)容包括專利技術(shù)的結(jié)構(gòu)示意圖、流程工藝圖技術(shù)構(gòu)造圖

5、已全新升級為極速版,下載速度顯著提升!歡迎使用!

請您登陸后,進(jìn)行下載,點(diǎn)擊【登陸】 【注冊】

關(guān)于我們 尋求報道 投稿須知 廣告合作 版權(quán)聲明 網(wǎng)站地圖 友情鏈接 企業(yè)標(biāo)識 聯(lián)系我們

鉆瓜專利網(wǎng)在線咨詢

周一至周五 9:00-18:00

咨詢在線客服咨詢在線客服
tel code back_top
主站蜘蛛池模板: 高清欧美xxxx| 一色桃子av大全在线播放| 精品国产鲁一鲁一区二区作者 | 国产一区二区综合| 中文字幕在线一二三区| 精品久久久综合| 久久精品一二三四| 国产精品suv一区二区6| 亚洲国产精品91| 精品国产一区二区三区麻豆免费观看完整版 | 免费午夜在线视频| 国产黄色网址大全| 国产欧美一区二区三区在线播放| 欧美视屏一区二区| 欧美日韩国产精品一区二区三区| 国产午夜亚洲精品羞羞网站| 欧美一区二区三区免费观看视频| 久久久999精品视频| 99视频国产在线| 国产天堂一区二区三区| 午夜伦全在线观看| 亚洲国产精品网站| 欧美日韩国产精品综合| 日韩精品一区二区三区在线| 97久久精品一区二区三区观看| 国产影院一区二区| 久久一区二区视频| 午夜影院你懂的| 国产性猛交xx乱| 99久久久国产精品免费无卡顿| 91精品视频一区二区| 亚洲**毛茸茸| 97国产精品久久| 国产精品无码永久免费888| 亚洲午夜久久久久久久久电影院| 欧美乱妇高清无乱码一级特黄| 国产精品一二三四五区| 国产日韩欧美不卡| 欧美在线播放一区| 伊人久久婷婷色综合98网| 欧美激情视频一区二区三区| 亚洲乱视频| 免费视频拗女稀缺一区二区| 7777久久久国产精品| 欧美福利三区| 国产一区二区精品在线| 午夜一级电影| 欧美一区二区三区国产精品| 国产精品中文字幕一区| 性欧美激情日韩精品七区| 亚洲精品国产一区二| 国产高清在线一区| 午夜剧场一级片| 99国产精品久久久久99打野战| 欧美精品一区二区三区四区在线| 欧美色综合天天久久| 亚洲欧美日韩在线看| 一区二区三区精品国产| 九九国产精品视频| 欧美一区二区三区在线免费观看| 国产91精品一区二区麻豆亚洲| 91人人精品| 久久99精品国产麻豆婷婷| 国产精一区二区三区| 久久99中文字幕| 国产一区二区午夜| 对白刺激国产对白精品城中村| 国产91热爆ts人妖系列| 欧美精品一区久久| 亚洲欧美一区二| 欧美国产三区| 久久国产精品网站| 午夜免费一级片| 国产精品自拍在线观看| 免费a一毛片| 日韩中文字幕在线一区| 亚洲美女在线一区| 精品综合久久久久| 中文无码热在线视频| 国产精品19乱码一区二区三区| 97人人澡人人爽91综合色| 国产在线拍揄自揄拍| 午夜影院啪啪| 国产精品天堂网| 久久福利视频网| 欧美一区二区综合| 91免费视频国产| 国产偷自视频区视频一区二区| 中文字幕欧美一区二区三区| 午夜黄色大片| 日本午夜影视| 久久天天躁夜夜躁狠狠躁2022| 国产资源一区二区三区| 亚洲色欲色欲www| xxxxx色| 色婷婷精品久久二区二区6| 亚洲第一天堂无码专区| 国产精品综合一区二区三区| 久久99久久99精品免观看软件 | 欧美日韩中文字幕三区| 免费超级乱淫视频播放| 国产欧美日韩中文字幕| 日韩精品中文字幕在线播放| 日韩av一二三四区| 99久久精品国| 伊人av综合网| 欧美日韩一区二区三区69堂| 91精品综合| 欧美一区二区三区久久综合| 99久久国产综合| 亚洲精品久久久久999中文字幕 | 中文字幕在线播放一区| 69久久夜色精品国产69–| 精品国产品香蕉在线| 国产精品免费自拍| 国产综合久久精品| 国产日韩欧美亚洲| 岛国精品一区二区| 国产伦精品一区二区三区电影| 国产精品区一区二区三| 国产精品二区一区二区aⅴ| 99久久国产综合精品女不卡| 99re热精品视频国产免费| 国产精品一区久久人人爽| 午夜影院h| 国产午夜亚洲精品| 欧美日韩一级二级三级| 精品中文久久| 久久人人爽爽| 国产精品高清一区| 国产中文字幕一区二区三区| 国产午夜精品一区二区三区视频| 亚洲国产精品国自产拍av| 亚州精品中文| 欧美激情在线一区二区三区| 欧美高清视频一区二区三区| 国产精品三级久久久久久电影| 欧美一区二区三区四区五区六区| 在线国产二区| 亚洲欧美一二三| 国产精品v欧美精品v日韩精品v | 日韩av视屏在线观看| 国产一二区精品| 午夜伦理片在线观看| 亚洲午夜精品一区二区三区| 国内精品久久久久久久星辰影视| 99精品久久99久久久久| 日日夜夜亚洲精品| 久久久精品观看| 国产欧美视频一区二区| 国产视频一区二区在线播放| 国产午夜精品一区理论片飘花 | 性欧美1819sex性高播放| 午夜大片网| 亚洲视频h| 亚洲精品日韩激情欧美| 久久国产精品波多野结衣| 精品国产九九| 国产精品久久久爽爽爽麻豆色哟哟 | 满春阁精品av在线导航| 在线视频国产一区二区| 亚洲制服丝袜在线| 亚洲国产精品国自产拍av| 国产精品女人精品久久久天天| 亚洲精品一区,精品二区| 国产精品视频1区| 中文乱幕日产无线码1区| 亚洲国产视频一区二区三区| 色噜噜狠狠狠狠色综合久| 中文字幕国内精品| 国产偷国产偷亚洲清高| 一区二区三区欧美日韩| 夜夜精品视频一区二区| 国产精品伦一区二区三区级视频频 | 国产精品一区二区免费| 最新国产精品久久精品| 久久影院一区二区| 国产精品免费自拍| 26uuu亚洲国产精品| 亚洲欧美国产一区二区三区| 91福利试看| 日本五十熟hd丰满| 午夜电影一区二区三区| 久久一级精品| xx性欧美hd| 日韩av在线影院| 特高潮videossexhd| 久久一区二区三区视频| 国产欧美精品一区二区三区小说| 亚洲欧美国产日韩色伦| 在线中文字幕一区| 二区三区免费视频| 夜夜嗨av一区二区三区中文字幕| 国产精品99一区二区三区| 亚洲欧美v国产一区二区| 19videosex性欧美69| 国产91久| 国语精品一区| 99久久夜色精品国产网站| 97久久精品人人做人人爽50路| 色乱码一区二区三在线看| 在线亚洲精品| 国产一卡在线| 欧美日韩高清一区二区| 999偷拍精品视频| 满春阁精品av在线导航| 首页亚洲欧美制服丝腿 | 国产影院一区二区| 久久96国产精品久久99软件| 久精品国产| 国产精品国产三级国产aⅴ下载| 97久久精品一区二区三区观看| 国产91九色在线播放| 综合久久一区二区三区| 国产精品二区一区二区aⅴ| 88国产精品欧美一区二区三区三| 99国产精品一区二区| 亚洲欧美国产精品va在线观看| 国产精品二区一区| 丰满岳妇伦4在线观看| 欧美精品一区二区性色| 国产午夜一级一片免费播放| 国产精品剧情一区二区三区| 午夜特片网| 久久精品国产精品亚洲红杏| 国产色婷婷精品综合在线手机播放| 日本三级韩国三级国产三级| 国产大片一区二区三区| 日本不卡精品| 国产综合久久精品| xxxx18日本护士高清hd| 欧美性受xxxx狂喷水| 激情久久一区| 九一国产精品| 国产精品入口麻豆九色| 久久密av| 日韩av在线播| 99色精品视频| 日韩精品一区二区免费| 91精品视频免费在线观看| 亚洲欧美中日精品高清一区二区| 精品一区二区三区视频?| 97精品国产97久久久久久免费| 日韩一区免费| 国产足控福利视频一区| 国内精品久久久久久久星辰影视|