日韩在线一区二区三区,日本午夜一区二区三区,国产伦精品一区二区三区四区视频,欧美日韩在线观看视频一区二区三区 ,一区二区视频在线,国产精品18久久久久久首页狼,日本天堂在线观看视频,综合av一区

[發明專利]一種精確的語料類別標注方法及裝置在審

專利信息
申請號: 201310163422.6 申請日: 2013-05-07
公開(公告)號: CN104142912A 公開(公告)日: 2014-11-12
發明(設計)人: 李成洲;徐興軍 申請(專利權)人: 百度在線網絡技術(北京)有限公司
主分類號: G06F17/27 分類號: G06F17/27
代理公司: 北京鴻德海業知識產權代理事務所(普通合伙) 11412 代理人: 袁媛
地址: 100085 北京*** 國省代碼: 北京;11
權利要求書: 查看更多 說明書: 查看更多
摘要:
搜索關鍵詞: 一種 精確 語料 類別 標注 方法 裝置
【說明書】:

【技術領域】

發明涉及數據處理技術,特別涉及一種精確的語料類別標注方法及裝置。

【背景技術】

語料標注類別的準確性是保證利用這些語料訓練得到的分類模型的準確性的關鍵。現有技術中,主要是通過人工的方式進行語料標注的,而人工標注難以避免人的主觀性,由于人受知識結構所限,對不熟悉領域的語料標注常出現錯誤。如“紫蘇提取物的特性及應用”,有的人可能會標注為化學類別,有的人可能會標注為生物類別。

【發明內容】

本發明所要解決的技術問題是提供一種精確的語料類別標注方法及裝置,以提高用于訓練分類模型的語料標注的準確性。

本發明為解決技術問題而采用的技術方案是提供一種精確的語料類別標注方法,包括:A.將具有初始標注類別的全部語料分為n份,其中1份語料作為校驗語料,其余n-1份語料作為訓練語料,且n為大于1的正整數;B.提取訓練語料的代表性特征;C.對訓練語料的代表性特征進行機器學習,以得到分類模型;D.采用所述分類模型對校驗語料進行分類,得到校驗語料的二次標注類別;E.對二次標注類別與初始標注類別之間存在差異的校驗語料的類別進行校正;F.從所述n份語料中選取1份未曾校正的語料作為校驗語料,其余n-1份語料作為訓練語料,返回所述步驟B。

根據本發明之一優選實施例,所述方法在所述步驟F后進一步包括:將校正后的類別作為語料的初始標注類別,并在滿足終止條件前重復執行所述步驟A至所述步驟F。

根據本發明之一優選實施例,所述終止條件至少包括以下一種:所述方法的執行時間達到預設值;或者所述步驟A至所述步驟F的重復執行次數達到預設值;或者當次重復執行時,需要校正的語料在全部語料中所占比例低于預設值。

根據本發明之一優選實施例,所述語料為文本語料。

根據本發明之一優選實施例,所述步驟B包括:B1.采用特征選擇算法確定訓練語料的代表性特征;B2.計算訓練語料的代表性特征對應的權重。

本發明還提供了一種精確的語料類別標注裝置,包括:分割單元,用于將具有初始標注類別的全部語料分為n份,其中1份語料作為校驗語料,其余n-1份語料作為訓練語料,且n為大于1的正整數;特征提取單元,用于提取訓練語料的代表性特征;訓練單元,用于對訓練語料的代表性特征進行機器學習,以得到分類模型;分類單元,用于采用所述分類模型對校驗語料進行分類,得到校驗語料的二次標注類別;校正單元,用于對二次標注類別與初始標注類別之間存在差異的校驗語料的類別進行校正;語料選取單元,用于從所述n份語料中選取1份未曾校正的語料作為校驗語料,其余n-1份語料作為訓練語料,并觸發所述特征提取單元執行。

根據本發明之一優選實施例,所述裝置進一步還包括:迭代單元,用于將校正后的類別作為語料的初始標注類別,并在滿足終止條件前觸發所述分割單元至所述語料選取單元重復執行。

根據本發明之一優選實施例,所述終止條件至少包括以下一種:所述裝置的執行時間達到預設值;或者所述分割單元至所述語料選取單元的重復執行次數達到預設值;或者當次重復執行時,需要校正的語料在全部語料中所占比例低于預設值。

根據本發明之一優選實施例,所述語料為文本語料。

根據本發明之一優選實施例,所述特征提取單元包括:特征選取單元,用于采用特征選擇算法確定訓練語料的代表性特征;權重計算單元,用于計算訓練語料的代表性特征對應的權重。

由以上技術方案可以看出,本發明通過將具有初始標注的全部語料分為若干份,每次選取其中一份作為校驗語料,其余作為訓練語料獲取分類模型,以對校驗語料進行校正,能夠極大地降低語料標注中的錯誤,提高語料標注的準確性。

【附圖說明】

圖1為本發明中精確的語料類別標注方法的實施例的流程示意圖;

圖2為本發明中精確的語料類別標注裝置的實施例一的結構示意框圖;

圖3為本發明中精確的語料類別標注裝置的實施例二的結構示意框圖。

【具體實施方式】

為了使本發明的目的、技術方案和優點更加清楚,下面結合附圖和具體實施例對本發明進行詳細描述。

請參考圖1,圖1為本發明中精確的語料類別標注方法的實施例的流程示意圖。如圖1所示,該實施例包括:

步驟S1:將具有初始標注類別的全部語料分為n份,其中1份語料作為校驗語料,其余n-1份語料作為訓練語料,且n為大于1的正整數。

步驟S2:提取訓練語料的代表性特征。

步驟S3:對訓練語料的代表性特征進行機器學習,以得到分類模型。

下載完整專利技術內容需要扣除積分,VIP會員可以免費下載。

該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于百度在線網絡技術(北京)有限公司,未經百度在線網絡技術(北京)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服

本文鏈接:http://www.szxzyx.cn/pat/books/201310163422.6/2.html,轉載請聲明來源鉆瓜專利網。

×

專利文獻下載

說明:

1、專利原文基于中國國家知識產權局專利說明書;

2、支持發明專利 、實用新型專利、外觀設計專利(升級中);

3、專利數據每周兩次同步更新,支持Adobe PDF格式;

4、內容包括專利技術的結構示意圖流程工藝圖技術構造圖

5、已全新升級為極速版,下載速度顯著提升!歡迎使用!

請您登陸后,進行下載,點擊【登陸】 【注冊】

關于我們 尋求報道 投稿須知 廣告合作 版權聲明 網站地圖 友情鏈接 企業標識 聯系我們

鉆瓜專利網在線咨詢

周一至周五 9:00-18:00

咨詢在線客服咨詢在線客服
tel code back_top
主站蜘蛛池模板: 午夜一级免费电影| 国产中文字幕一区二区三区 | 午夜影院一区| 狠狠色丁香久久综合频道| 日韩欧美一区精品| 久久久精品久久日韩一区综合| 国产精品欧美一区乱破| 狠狠色很很在鲁视频| 91麻豆产精品久久久| 久久久久亚洲最大xxxx| 久草精品一区| 亚洲高清毛片一区二区| 久久国产欧美一区二区三区免费| 欧美日韩久久一区二区| 一区二区久久久久| 91久久国产视频| 欧美国产一二三区| 黄色av免费| 色综合久久久久久久粉嫩| 亚洲精品久久久久玩吗| 久久久精品欧美一区二区| 亚洲欧美日韩在线| 狠狠色丁香久久综合频道| 国产欧美一区二区在线| freexxxx性| 国产一卡在线| 国产一区二区在线91| 亚洲精品国产91| 色婷婷综合久久久久中文| xxxxx色| 欧美hdxxxx| 精品91av| 国产精品电影一区二区三区| 久久久精品二区| 国产二区视频在线播放| 91精品色| 欧美一区二区三区精品免费| 午夜毛片在线看| 综合欧美一区二区三区| 久久福利免费视频| 日本高清二区| 精品国产鲁一鲁一区二区作者| 亚洲日韩欧美综合| 欧美激情视频一区二区三区| 狠狠色狠狠色综合系列| 国产精品视频久久久久久久| 精品99免费视频| 欧美日韩激情一区二区| 国产精品乱战久久久| 高清欧美精品xxxxx在线看| 日本xxxxxxxxx68护士| 91丝袜国产在线播放| 国产精品日韩一区二区| 久久国产麻豆| 久久两性视频| 99日本精品| 午夜剧场a级片| 欧美日韩国产在线一区| 久久久久久久国产| 国产午夜精品av一区二区麻豆| 夜夜躁狠狠躁日日躁2024| 女人被爽到高潮呻吟免费看| 高清国产一区二区三区| 国产一区二区在线观看免费| 午夜免费片| 视频国产一区二区| 久久人人爽爽| 国产精品久久久爽爽爽麻豆色哟哟 | 日韩午夜三级| 久久久精品观看| 国产偷国产偷亚洲清高| 91视频一区二区三区| 国产欧美一区二区三区精品观看| 91国产在线看| 欧美高清视频一区二区三区| 国产日产欧美一区| 日韩亚洲精品视频| 久久久久亚洲精品视频| 亚洲精品一品区二品区三品区| 夜色av网站| 精品久久久综合| 97一区二区国产好的精华液| 亚洲国产美女精品久久久久∴| 8x8x国产一区二区三区精品推荐 | 对白刺激国产对白精品城中村| 国产精品欧美一区二区三区| 强行挺进女警紧窄湿润| 浪潮av色| 国产精品久久久久99| 一区二区欧美视频| 99er热精品视频国产| 国产精品免费观看国产网曝瓜| 夜夜爽av福利精品导航| 久久婷婷国产香蕉| 国产精品一二三区视频网站| 欧美日韩综合一区二区| 国产日产高清欧美一区二区三区| 国产丝袜在线精品丝袜91| 国产区91| 99久久久久久国产精品| 久久97国产| 日本精品一二区| 欧美精品国产精品| 一区二区中文字幕在线观看| 99久久夜色精品| 国91精品久久久久9999不卡| 国产九九影院| 亚洲精品久久久久玩吗| 丰满岳乱妇在线观看中字| 夜夜爽av福利精品导航| 99er热精品视频国产| 欧美在线一区二区视频| 国产精品高潮呻| 日韩一级视频在线| 久久国产精品久久久久久电车| 亚洲第一天堂无码专区| 欧美髙清性xxxxhdvid| 精品无人国产偷自产在线| 国产的欧美一区二区三区 | 麻豆视频免费播放| 亚洲欧美一卡| 欧美日韩一区二区在线播放| 天天射欧美| 99国产精品免费观看视频re| 91麻豆精品国产91久久久更新时间| 一区二区三区国产视频| 亚洲欧美日韩精品suv| 小萝莉av| 97国产精品久久久| 精品婷婷伊人一区三区三| 国产1区2| 国产网站一区二区| 一区二区三区欧美视频| 午夜黄色一级电影| 欧美极品少妇xx高潮| 国产精品白浆一区二区| 亚洲精品久久在线| 午夜无人区免费网站| 窝窝午夜精品一区二区| 91社区国产高清| 中文字幕一级二级三级| 亚洲精品日本无v一区| 一区二区欧美视频| 偷拍精品一区二区三区| 日韩av在线网址| 国产淫片免费看| 色一情一交一乱一区二区三区| 国产麻豆91欧美一区二区| 亚洲精品一区二区三区香蕉| 精品a在线| 欧美日韩中文不卡| 欧美亚洲精品suv一区| 欧美日韩国产在线一区| 久久久综合香蕉尹人综合网| 午夜国产一区| 国产二区三区视频| 91区国产| 午夜性电影| 亚洲国产精品97久久无色| 精品国产鲁一鲁一区二区作者| 午夜av电影网| 国产91电影在线观看| 一本大道久久a久久精品| 国产精品欧美一区二区三区| 日韩久久精品一区二区| 久久午夜精品福利一区二区| 狠狠色综合久久婷婷色天使| 日韩av电影手机在线观看| 国产精品日韩视频| 国产香蕉97碰碰久久人人| 久久久久久国产一区二区三区| 日韩中文字幕亚洲欧美| 国产精品不卡在线| 午夜老司机电影| 国产精品乱码久久久久久久| 91偷自产一区二区三区精品 | 国产午夜精品一区二区三区最新电影| 国产一区二区在线免费| 日韩国产不卡| 午夜影皖精品av在线播放| 午夜av片| 91久久香蕉国产日韩欧美9色| 国产免费第一区| 乱淫免费视频| 日韩国产精品久久| 国产欧美二区| 91性高湖久久久久久久久_久久99| 毛片免费看看| 国产乱老一区视频| 在线视频国产一区二区| 国产伦理一区| 国产日韩欧美综合在线| 理论片高清免费理伦片| 色噜噜日韩精品欧美一区二区| 国产一区在线精品| 日本大码bbw肉感高潮 | 国产日韩一区二区三区| 国产欧美三区| 狠狠色噜噜狠狠狠狠米奇7777| 日韩精品1区2区3区| 亚洲精品国产91| 久99久精品| 色噜噜狠狠色综合影视| 99精品黄色| 高清欧美xxxx| 亚洲区在线| 夜色av网站| 精品国产鲁一鲁一区二区三区| 国产精品九九九九九| 欧美精品一区二区三区视频| 国产69精品福利视频| 国产一级不卡视频| 综合国产一区| 色午夜影院| 亚洲精欧美一区二区精品| 国产高清不卡一区| 在线观看黄色91| 欧美一区二区久久| 亚洲国产欧洲综合997久久,| 黄色91在线观看| 538在线一区二区精品国产| 福利片一区二区三区| 亚洲精品乱码久久久久久国产主播| 99爱精品视频| 国产日韩欧美自拍| 国产欧美一区二区精品久久| 亚洲精品色婷婷| 在线观看v国产乱人精品一区二区 国产日韩欧美精品一区二区 | 精品美女一区二区三区| 国产一级不卡视频| 国久久久久久| 97欧美精品| 久久久中精品2020中文| 国产精品高潮在线| 国产精品久久久久久久四虎电影| 国产电影一区二区三区下载| 十八无遮挡| 亚洲欧美一二三| 中文字幕一区二区三区日韩精品| 精品国产乱码久久久久久老虎| 午夜影院啊啊啊| 色妞妞www精品视频| 欧美日韩综合一区二区| 最新国产精品久久精品| 免费毛片**| 午夜av资源|