日韩在线一区二区三区,日本午夜一区二区三区,国产伦精品一区二区三区四区视频,欧美日韩在线观看视频一区二区三区 ,一区二区视频在线,国产精品18久久久久久首页狼,日本天堂在线观看视频,综合av一区

[發(fā)明專利]不平衡數(shù)據(jù)集上生物醫(yī)學(xué)多參事件抽取的新方法有效

專利信息
申請?zhí)枺?/td> 201611138305.4 申請日: 2016-12-12
公開(公告)號: CN106777957B 公開(公告)日: 2019-07-30
發(fā)明(設(shè)計)人: 盧奕南;路揚;馬小蕾;潘航宇;閆雪 申請(專利權(quán))人: 吉林大學(xué)
主分類號: G16H50/70 分類號: G16H50/70;G06F17/27;G06K9/62
代理公司: 長春市恒譽專利代理事務(wù)所(普通合伙) 22212 代理人: 鞠傳龍
地址: 130012 吉*** 國省代碼: 吉林;22
權(quán)利要求書: 查看更多 說明書: 查看更多
摘要:
搜索關(guān)鍵詞: 不平衡 數(shù)據(jù) 生物醫(yī)學(xué) 參事 抽取 新方法
【說明書】:

發(fā)明公開了一種不平衡數(shù)據(jù)集上生物醫(yī)學(xué)多參事件抽取的新方法,步驟如下:第一部分:步驟1:獲取序列庫;步驟2:構(gòu)造序列數(shù)據(jù)庫S;步驟3:給定最小支持度閾值;步驟4:判斷序列個數(shù);第二部分:步驟1:在選擇的樣本集上提取四類特征;步驟2:得到多類別的分類器;第三部分:步驟1:計算相似度;步驟2:計算觸發(fā)詞重要度步驟3:合并重要度和相似度Sim(ti,aj,ak)得到聯(lián)合評分Score(ti,aj,ak);步驟4:給定閾值δ。有益效果:采用數(shù)據(jù)挖掘和自然語言處理技術(shù),方法靈活,易于實現(xiàn),可達到很高的準(zhǔn)確度。

技術(shù)領(lǐng)域

本發(fā)明涉及一種生物醫(yī)學(xué)多參事件抽取的新方法,特別涉及一種不平衡數(shù)據(jù)集上生物醫(yī)學(xué)多參事件抽取的新方法。

背景技術(shù)

當(dāng)前,生物醫(yī)學(xué)文獻提供了豐富的科學(xué)知識來源,由于非結(jié)構(gòu)化或半結(jié)構(gòu)化的生物醫(yī)學(xué)文獻的快速增長,科研工作者需要大量的精力和時間來獲得相關(guān)的科學(xué)知識。自動抽取生物醫(yī)學(xué)事件可以應(yīng)用到許多生物醫(yī)學(xué)領(lǐng)域。在事件抽取任務(wù)中,基于規(guī)則的方法和基于機器學(xué)習(xí)的方法是目前主要的方法。基于規(guī)則的方法同生物醫(yī)學(xué)關(guān)系抽取中基于模式的方法類似,手工定義句法規(guī)則,然后在訓(xùn)練數(shù)據(jù)集中學(xué)習(xí)得到規(guī)則,從而抽取出事件。基于機器學(xué)習(xí)的方法把抽取任務(wù)看成是分類問題。以上這些方法很少提及到的一個問題就是訓(xùn)練數(shù)據(jù)是高度不平衡的,負(fù)樣本的數(shù)目遠(yuǎn)低于正樣本的數(shù)目;而且大多數(shù)的多參事件抽取方法都遵循管道模型,在對抽取的基礎(chǔ)上,進一步抽取多元關(guān)系,這樣容易造成級聯(lián)錯誤。這種方法直接抽取多元關(guān)系的方法,對樣本進行過濾平衡訓(xùn)練的正負(fù)樣本,得到用于分類的有意義的樣本集;以及采用聯(lián)合評分機制對預(yù)測結(jié)果進行修正,可提高預(yù)測的精度。

發(fā)明內(nèi)容

本發(fā)明的目的是為了在高度不平衡的生物醫(yī)學(xué)文獻上進行精確的生物醫(yī)學(xué)多參事件的自動抽取,而提供的一種不平衡數(shù)據(jù)集上生物醫(yī)學(xué)多參事件抽取的新方法。

本發(fā)明提供的不平衡數(shù)據(jù)集上生物醫(yī)學(xué)多參事件抽取的新方法,其具體方法如下所述:

所需條件:生物文獻的語料庫,nltk、nltk.org分詞和分句工具以及生物醫(yī)學(xué)依存路徑分析工具以及抽取模型特征系統(tǒng);待檢測的生物醫(yī)學(xué)文本,普通PC機;

實現(xiàn)步驟如下:

第一部分:通過對生物文獻語料庫進行預(yù)處理,獲取多參數(shù)事件的特征,以及采用序列模式的方法平衡訓(xùn)練的正負(fù)樣本,從而得到用于分類的有意義的樣本集,具體步驟如下:

步驟1:開始,對給定的語料庫進行分詞、分句、詞性標(biāo)注和路徑依存分析獲取序列庫;

步驟2:定義句子中的候選觸發(fā)詞集,它們來源于觸發(fā)詞字典,而蛋白質(zhì)和觸發(fā)詞構(gòu)成參數(shù)集,蛋白質(zhì)來源于蛋白質(zhì)字典,這樣生成候選觸發(fā)詞和各個參數(shù)形成的對集,將這些對集所包含的依存路徑中的關(guān)鍵字構(gòu)造序列數(shù)據(jù)庫S;

步驟3:給定最小支持度閾值,利用序列模式算法在生成的序列庫S中挖掘出頻繁的規(guī)則或者模式;

步驟4:對無標(biāo)簽的樣本判斷其依存路徑是否包含頻繁模式序列個數(shù),即大于給定的閾值,否則將其過濾并去掉一些負(fù)樣本;

第二部分:在選擇的樣本特征集上訓(xùn)練得到基于支持向量機的預(yù)測模型,具體步驟如下:

步驟1:在選擇的樣本集上提取四類特征,包括Token特征、句子特征、詞袋特征和外部資源特征;

步驟2:應(yīng)用支持向量機方法進行訓(xùn)練得到多類別的分類模型;

下載完整專利技術(shù)內(nèi)容需要扣除積分,VIP會員可以免費下載。

該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于吉林大學(xué),未經(jīng)吉林大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服

本文鏈接:http://www.szxzyx.cn/pat/books/201611138305.4/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。

同類專利
專利分類
×

專利文獻下載

說明:

1、專利原文基于中國國家知識產(chǎn)權(quán)局專利說明書;

2、支持發(fā)明專利 、實用新型專利、外觀設(shè)計專利(升級中);

3、專利數(shù)據(jù)每周兩次同步更新,支持Adobe PDF格式;

4、內(nèi)容包括專利技術(shù)的結(jié)構(gòu)示意圖流程工藝圖技術(shù)構(gòu)造圖

5、已全新升級為極速版,下載速度顯著提升!歡迎使用!

請您登陸后,進行下載,點擊【登陸】 【注冊】

關(guān)于我們 尋求報道 投稿須知 廣告合作 版權(quán)聲明 網(wǎng)站地圖 友情鏈接 企業(yè)標(biāo)識 聯(lián)系我們

鉆瓜專利網(wǎng)在線咨詢

周一至周五 9:00-18:00

咨詢在線客服咨詢在線客服
tel code back_top
主站蜘蛛池模板: 久久精品欧美一区二区| 亚洲欧洲一二三区| 狠狠色噜噜狠狠狠狠88| 亚洲精品一区,精品二区| 亚洲欧美国产一区二区三区 | 亚洲精品一区在线| 久久久久亚洲精品视频| 日本看片一区二区三区高清| 国产二区三区视频| av午夜在线| 日本免费电影一区二区| 欧美3级在线| 日本高清h色视频在线观看| 久久国产精品欧美| 亚洲精品一区二区三区98年| 国产欧美精品一区二区在线播放| 狠狠色丁香久久婷婷综合丁香| 午夜天堂在线| aaaaa国产欧美一区二区| 久久精品国产综合| 亚洲影院久久| 91精品啪在线观看国产手机| 国产精品影音先锋| 国产亚洲欧美日韩电影网| 福利电影一区二区三区| 激情欧美一区二区三区| 久久99中文字幕| 午夜一级免费电影| 国产91色综合| 国产91丝袜在线熟| 91精品一区二区在线观看| 日韩国产精品一区二区| 国产精品一区一区三区| 人人玩人人添人人澡97| 国产一区在线视频播放| 午夜一区二区视频| 亚洲精品97久久久babes| 中文av一区| 69精品久久| 人人澡超碰碰97碰碰碰| 狠狠色狠狠色综合日日2019 | 久久久久国产精品嫩草影院| 亚洲精品丝袜| 国产在线精品区| 国产一区二区综合| 99久久婷婷国产综合精品电影| 午夜性电影| 日韩欧美一区二区久久婷婷| 欧美黄色片一区二区| 99久久免费精品国产免费高清| 国产精品九九九九九| 国产精品不卡一区二区三区 | 国产国产精品久久久久| 国产精品国产亚洲精品看不卡15| 91久久久爱一区二区三区| 国产不卡一区在线| 蜜臀久久99静品久久久久久| 国内少妇自拍视频一区| 91亚洲欧美日韩精品久久奇米色| 97人人揉人人捏人人添| 亚洲五码在线| 狠狠干一区| 日本xxxxxxxxx68护士| 欧美黑人巨大久久久精品一区| 九九国产精品视频| 对白刺激国产对白精品城中村| 国产精品9区| 午夜精品一二三区| 一级久久精品| 国产女人和拘做受在线视频| 欧美性猛交xxxxxⅹxx88| 国产欧美视频一区二区| 久久久精品二区| 午夜影院试看五分钟| 国产精品日韩在线观看| 久久99国产精品久久99果冻传媒新版本| 国产1区2区视频| 国产精品美女久久久另类人妖| 国产一区日韩欧美| 欧美777精品久久久久网| 亚洲乱视频| 国模吧一区二区|