日韩在线一区二区三区,日本午夜一区二区三区,国产伦精品一区二区三区四区视频,欧美日韩在线观看视频一区二区三区 ,一区二区视频在线,国产精品18久久久久久首页狼,日本天堂在线观看视频,综合av一区

[發明專利]一種基于組合特征加權的科技文獻標注精簡研究結論的方法流程在審

專利信息
申請號: 201610125685.1 申請日: 2016-03-04
公開(公告)號: CN107153664A 公開(公告)日: 2017-09-12
發明(設計)人: 賀惠新;史亞平;張魏巍;熊海濤 申請(專利權)人: 同方知網(北京)技術有限公司;《中國學術期刊(光盤版)》電子雜志社有限公司
主分類號: G06F17/30 分類號: G06F17/30
代理公司: 北京遠大卓悅知識產權代理事務所(普通合伙)11369 代理人: 史霞
地址: 100084 北京市海淀區清華*** 國省代碼: 北京;11
權利要求書: 查看更多 說明書: 查看更多
摘要:
搜索關鍵詞: 一種 基于 組合 特征 加權 科技 文獻 標注 精簡 研究 結論 方法 流程
【權利要求書】:

1.一種基于組合特征加權的科技文獻標注精簡研究結論的方法流程,其特征在于:包括分類抽取流程,既是基于訓練語料,做數據前清洗,然后分句獲得句子和類標簽,句子特征選擇進行特征化,然后訓練分類器,評價分類器,對訓練的分類器進行保存序列化,在應用階段,獲得應用文本,對其同樣數據清洗,分句,然后特征化(應用階段chi詞特征是使用訓練階段的chi詞),加載訓練分類器對應用文本進行研究結論預測,之后對預測的結果句子人工審核,進行后數據清洗處理,然后將這些清洗規則加入到原有程序中,迭代實驗,具體的步驟如下:

步驟一:前數據清洗模塊

由于句子本身會有亂碼公式表格英文字母數字等,需要對句子進行預處理去掉這些臟東西,在這里需要數據前清洗,閱讀大量待處理的文本,總結出的文本前處理特點,結合其特點采用規則處理清洗;

步驟二:訓練階段模塊

獲取訓練樣本全文文本,這些訓練樣本全部經過人工標注,即對全文字段中的全部內容(這里指的是正文的全部內容,不包括參考文獻等),按照句子級別(句號)標出屬于研究結論的句子,非研究結論的句子不予標注,一篇文章可以標注多個結論句子,經過程序處理獲得全篇的句子(保持原文句子順序)和對應的標簽屬于研究結論的句子對應的標簽為正例1,不屬于研究結論的句子對應標簽為反例0,假如一篇被標注的文章有50句子,標記為研究結論的5句,其余45句是非研究結論,那么正例就是5句話,反例45句話,這樣就獲得了句子樣本數據,假如有10篇標注的文章,那么按照文章的順序,每篇文章分50個句子,那么就是500個句子,具體的,訓練過程的算法為:

(1)獲取樣本

獲取訓練樣本文句子記錄為集合Sens={Sens(i)},對應的句子訓練標簽 集合為Labels={Labels(i)},句子總數為N,各個句子表示為Sens(i),其中1=<i<=N,要求N盡可能大,N>=10000,Labels(i)的取值為1或0兩種取值,其中1代表本句子是研究結論句,為正例表示,0代表本句子是非研究結論句子,為反例表示;

(2)對訓練語料Sens(i)句子進行特征化表示,句子特征化這里使用了以下特征:人工標記的標識詞特征1個、chi詞頻特征200個、句子所在文章級別的相關特征4個、句子級別的相關特征10個、詞語級別的相關特征3個、句序特征1個、句序比特征1個、句子結論段特征4個,一共224個特征,可以表示為F={f1,f2,f3……fn},fi表示每個特征n為224,f0到f224一共224個特征,每個句子都要提取224個特征;

步驟三:選取分類器訓練與評價模塊

(31)樣本類平衡處理,這里分類屬于二分類問題,由于樣本中正例(研究結論句子很少),反例(非研究結論句子很多)造成樣本分布不均勻,對于這些不均勻樣本直接采用分類的話會影響分類效果,所以需要進行樣本類平衡處理,有三種辦法可以處理:1增加少數類樣本數量,2減少多數類樣本數量,3增加少數類樣本的權重比例。可以根據需要采用任何一種方法處理;

(32)訓練分類器,使用常用的分類器DecisionTree、SVM、GaussianNB、RandomForest、GradientBoosting等分別對輸入特征矩陣F和label訓練,可以選用5折交叉驗證,(80%數據訓練,20%的數據來測試)來平均訓練的分類器,某些情況下還要進行分類器的參數調優;

(33)評價分類器,評價參數主要是預測標簽的準確率,召回率,F值,a:正例測試文檔被正確分類為該類的數量,b:負例測試文檔被錯誤分類為屬于該類的數量,c:正例測試文檔被錯誤分類為不屬于該類的數量,d:負例測試文檔被正確分類為不屬于該類的數量,準確率precision=a/(a+b),召回率recall=a/(a=c),F=(2*precision*recall)/(precision+recall),選擇F值較大的分類器作為生成的模型,如果效果不太理想,需要調整分類器參數,選擇好分類器之后,將訓練得到的這個分類器序列化到硬盤上保存 起來,當需要應用測試的時候將其加載到內存即可進行應用預測;

步驟四:應用分類器預測研究結論標簽模塊

將待預測的rec文本全文字段的正文部分經過程序分句提取出對應的特征矩陣,{f0,f1......f223}這種形式,然后可以加載訓練保存的分類器模型進行預測出對應的研究結論標簽。

下載完整專利技術內容需要扣除積分,VIP會員可以免費下載。

該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于同方知網(北京)技術有限公司;《中國學術期刊(光盤版)》電子雜志社有限公司,未經同方知網(北京)技術有限公司;《中國學術期刊(光盤版)》電子雜志社有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服

本文鏈接:http://www.szxzyx.cn/pat/books/201610125685.1/1.html,轉載請聲明來源鉆瓜專利網。

×

專利文獻下載

說明:

1、專利原文基于中國國家知識產權局專利說明書;

2、支持發明專利 、實用新型專利、外觀設計專利(升級中);

3、專利數據每周兩次同步更新,支持Adobe PDF格式;

4、內容包括專利技術的結構示意圖流程工藝圖技術構造圖

5、已全新升級為極速版,下載速度顯著提升!歡迎使用!

請您登陸后,進行下載,點擊【登陸】 【注冊】

關于我們 尋求報道 投稿須知 廣告合作 版權聲明 網站地圖 友情鏈接 企業標識 聯系我們

鉆瓜專利網在線咨詢

周一至周五 9:00-18:00

咨詢在線客服咨詢在線客服
tel code back_top
主站蜘蛛池模板: 97精品国产97久久久久久粉红| 高清国产一区二区| 日本中文字幕一区| 精品在线观看一区二区| 17c国产精品一区二区| 久久亚洲精品国产日韩高潮| 日本一区二区三区在线视频| 日韩精品久久久久久中文字幕8| 国产在线拍偷自揄拍视频 | 亚洲国产欧美国产综合一区| 欧美激情视频一区二区三区免费| 538国产精品一区二区在线| 亚洲欧美日本一区二区三区| 国产日韩欧美综合在线| 在线国产一区二区三区| 国产精品久久久综合久尹人久久9| 国产精品视频久久久久久久| 国产精品9区| 97人人澡人人爽人人模亚洲| 久久精品国产亚洲7777| 国产欧美www| 色婷婷久久一区二区三区麻豆| 日本精品在线一区| 久久三级精品| 又色又爽又大免费区欧美| 鲁丝一区二区三区免费观看| 欧美日韩一区二区三区在线播放 | 不卡在线一区二区| 88888888国产一区二区| 免费毛片a| 夜色av网| 日日夜夜亚洲精品| 91一区在线观看| 国产丝袜一区二区三区免费视频| 狠狠色噜噜狠狠狠狠2021免费| 91午夜精品一区二区三区| 欧美精品国产一区二区| 国产理论片午午午伦夜理片2021| 中文字幕另类日韩欧美亚洲嫩草| 精品国产鲁一鲁一区二区三区| 伊人久久婷婷色综合98网| 久久精品国产综合| 福利视频亚洲一区| 国产69精品福利视频| 日本精品视频一区二区三区| 久久99精品国产麻豆婷婷洗澡| 日本一区午夜艳熟免费| 毛片大全免费看| 亚洲欧美国产精品一区二区| 久久久久国产一区二区三区不卡| 久久综合国产伦精品免费| 97人人模人人爽人人喊38tv| 国产精品二区一区二区aⅴ| 91avpro| xxxxhdvideosex| 日韩精品免费一区二区三区| 欧美激情在线观看一区| 99精品欧美一区二区三区美图| 色一情一乱一乱一区免费网站 | 久久久久国产亚洲日本| 热久久一区二区| 久久一区二区精品视频| 欧美一区二区三区久久| 精品国产乱码久久久久久软件影片| 午夜性电影| 93久久精品日日躁夜夜躁欧美| 日本精品三区| av不卡一区二区三区| 亚洲国产欧美一区二区三区丁香婷| 日韩av在线播| 三级午夜片| 国产精品免费观看国产网曝瓜| 欧美freesex极品少妇| 久久国产精品99国产精| 精品国产鲁一鲁一区二区作者| 日本aⅴ精品一区二区三区日| 91中文字幕一区| 亚洲国产一二区| 国产精品视频二区不卡| 国产69精品久久久久app下载| 国产精品一区不卡| 99re6国产露脸精品视频网站| 欧美一区二区三区在线视频观看| 国产欧美视频一区二区三区| 国产精品一区二区三| 欧美日韩中文国产一区发布| 久久精品欧美一区二区| 午夜三级电影院| 国产精品电影一区| 中文字幕欧美日韩一区| 午夜av免费看| 亚洲国产精品97久久无色| 免费xxxx18美国| 国产农村妇女精品一区二区 | 中文字幕在线乱码不卡二区区| 国产一区二区视频播放| 日韩一区免费| 亚洲精欧美一区二区精品| 激情久久一区| 国产综合久久精品| 亚洲三区在线| 久久一区二区三区视频| 少妇精品久久久久www蜜月| 浪潮av网站| **毛片免费| 日韩精品中文字幕在线播放| 99精品国产一区二区三区不卡 | 欧美一区二区三区另类| 狠狠色狠狠色综合久久一| 日韩精品免费一区二区三区| 91精品一区二区在线观看 | 欧美高清性xxxx| 少妇久久免费视频| 久久精品99国产精品亚洲最刺激| 美女被羞羞网站视频软件| 99久久久久久国产精品| 国产精品日本一区二区不卡视频| 国产不卡一二三区| 久久久久亚洲最大xxxx| 亚洲va欧美va国产综合先锋| 国产69精品久久久久久久久久| 午夜影院毛片| 国产原创一区二区| 欧美在线一区二区视频| 国产一二区精品| 欧美精品一区二区三区四区在线| 日本美女视频一区二区三区| 国产一区二区三区伦理| 国产精品国产三级国产专区52| 日韩av在线导航| 亚洲精品主播| 在线精品一区二区| 国产精品99久久久久久宅男| 久久精品国产亚洲7777| 欧美hdfree性xxxx| 理论片午午伦夜理片在线播放| 国产一区二区手机在线观看| 中文字幕欧美另类精品亚洲| 国产精品免费一区二区区| 99视频一区| 国产精品免费专区| 国产区精品区| 精品国产乱码久久久久久虫虫| 欧美日韩中文字幕一区| 麻豆精品国产入口| 国产在线精品一区| 李采潭无删减版大尺度| 午夜av电影院| 午夜免费网址| 久久综合激情网| 91精品久| 午夜精品在线观看| 在线中文字幕一区| 国产一区二| 在线亚洲精品| 日韩av在线一区| 精品中文久久| 美女张开腿黄网站免费| 狠狠色噜噜狠狠狠四色米奇| 国产午夜精品一区| 色一情一乱一乱一区99av白浆| 91精品第一页| 国产伦精品一区二区三区照片91| 浪潮av网站| 久久不卡一区| 久久亚洲精品国产一区最新章节| 欧美日韩一区二区高清| 国产精品久久久区三区天天噜| free×性护士vidos欧美| 日本三级香港三级| 狠狠色噜噜狠狠狠狠色综合久老司机| 日韩欧美国产第一页| 欧美一区久久| 狠狠躁天天躁又黄又爽| 私人影院av| 亚洲精品国产主播一区| 少妇高潮大叫喷水| 国产一区2区3区| 狠狠综合久久av一区二区老牛| 国产91九色视频| 亚洲第一天堂无码专区| 日韩精品中文字| 少妇中文字幕乱码亚洲影视| 国产福利精品一区| 午夜激情在线| 欧美大片一区二区三区| 99精品久久久久久久婷婷| 国产精品亚洲第一区| 亚洲国产精品一区在线观看| 午夜看片在线| 亚洲精品丝袜| 国产伦精品一区二区三区免费观看| 国产有码aaaae毛片视频| 久久99国产综合精品| 亚洲w码欧洲s码免费| 欧美网站一区二区三区| 亚洲欧美国产精品一区二区| 国产性生交xxxxx免费| 欧美一区二区性放荡片| 欧美日韩一区电影| 国产欧美视频一区二区| 久久国产精品广西柳州门| 午夜国产一区二区三区四区| 国产品久久久久久噜噜噜狼狼| 亚洲国产一区二| 99re久久精品国产| av午夜电影| 日韩精品少妇一区二区在线看| 国产精品自拍在线观看| 久久伊人色综合| 88888888国产一区二区| 搡少妇在线视频中文字幕| **毛片在线| 欧美性二区| 久久精品国产一区二区三区| sb少妇高潮二区久久久久| 欧美xxxxxhd| 一级久久久| 欧美国产一区二区三区激情无套| 国产一二区在线观看| 国产精品色在线网站| 最新国产精品自拍| 99精品黄色| 日韩精品一区二区三区中文字幕| 91久久国产露脸精品国产护士| av午夜影院| 男人的天堂一区二区| 精品视频在线一区二区三区| 国产精品国精产品一二三区| 中文字幕一区三区| 亚洲精品www久久久久久广东 | 在线国产一区二区| 四虎国产精品永久在线| 精品一区二区三区中文字幕| 国产精品久久久久免费a∨大胸| 亚洲欧洲日韩| 国产精品美女久久久另类人妖| 精品国产乱码久久久久久虫虫| 国产一区二区视频免费在线观看 | 日本一区二区三区免费播放| 国产福利精品一区| 国产精品美乳在线观看| 欧美乱码精品一区二区三| 精品久久一区| 午夜av男人的天堂| 亚洲国产精品二区|