日韩在线一区二区三区,日本午夜一区二区三区,国产伦精品一区二区三区四区视频,欧美日韩在线观看视频一区二区三区 ,一区二区视频在线,国产精品18久久久久久首页狼,日本天堂在线观看视频,综合av一区

[發(fā)明專利]一種基于定義與關(guān)系的術(shù)語抽取方法有效

專利信息
申請?zhí)枺?/td> 201710833633.4 申請日: 2017-09-15
公開(公告)號: CN107577670B 公開(公告)日: 2020-09-22
發(fā)明(設(shè)計)人: 許斌;李思良;楊玉基 申請(專利權(quán))人: 清華大學(xué)
主分類號: G06F40/284 分類號: G06F40/284;G06F40/289
代理公司: 北京眾合誠成知識產(chǎn)權(quán)代理有限公司 11246 代理人: 朱琨
地址: 100084 北京*** 國省代碼: 北京;11
權(quán)利要求書: 查看更多 說明書: 查看更多
摘要:
搜索關(guān)鍵詞: 一種 基于 定義 關(guān)系 術(shù)語 抽取 方法
【權(quán)利要求書】:

1.一種基于定義與關(guān)系的術(shù)語抽取方法,其特征在于,所述方法包括以下步驟:

步驟1:對html格式的文本進(jìn)行預(yù)處理與初始化,包括:

步驟1.1:識別文本中的img和table標(biāo)簽,過濾掉圖片和表格;

步驟1.2:過濾掉文本中的html標(biāo)簽,提取標(biāo)簽中的文本內(nèi)容;

步驟1.3:從清理后的文本中找出符號與公式,并進(jìn)行過濾;

步驟1.4:根據(jù)句號、逗號、分號與問號對文本進(jìn)行重新分段;

步驟1.5:利用ansj分詞工具對文本進(jìn)行中文分詞,并計算每個詞的詞頻;

步驟2:依據(jù)步驟1處理后得到的文本,進(jìn)行基于定義的術(shù)語候補抽取,生成一個術(shù)語候補集,包括:

步驟2.1:根據(jù)文本特點總結(jié)出定義模板,定義模板為正則表達(dá)式形式,包含被定義部分和定義部分兩個匹配內(nèi)容;

步驟2.2:通過步驟2.1制定的模板從文本中抽取出被定義部分和定義部分,被定義部分被標(biāo)記為右型候補,設(shè)置為低置信度,定義部分被標(biāo)記為左型候補,設(shè)置為高置信度;

步驟2.3:將新發(fā)現(xiàn)的術(shù)語候補添加到當(dāng)前的術(shù)語候補集中;

步驟3:利用步驟1處理后得到的文本與步驟2生成的所述術(shù)語候補集,進(jìn)行基于上下位關(guān)系的術(shù)語候補抽取,生成新的術(shù)語候補集,包括:

步驟3.1:根據(jù)文本特點總結(jié)出上下位模板;

步驟3.2:通過步驟3.1制定的模板從文本中抽取出下位部分和上位部分,若上位部分是已發(fā)現(xiàn)的術(shù)語,則將下位部分設(shè)置為右型候補,設(shè)置為低置信度,若下位部分是已發(fā)現(xiàn)的術(shù)語,則將上位部分設(shè)置為左型候補,設(shè)置為高置信度;

步驟3.3:將步驟3.2中發(fā)現(xiàn)的術(shù)語候補添加到當(dāng)前的術(shù)語候補集中;

步驟4:利用步驟1處理后得到的文本與步驟3生成的所述術(shù)語候補集,進(jìn)行基于整體部分關(guān)系的術(shù)語候補抽取,生成新的術(shù)語候補集,包括:

步驟4.1:根據(jù)文本特點總結(jié)出整體部分模板;

步驟4.2:通過步驟4.1制定的模板從文本中抽取出左部分和右部分,設(shè)左部分為s1,右部分為s2,s1的分詞結(jié)果為w1_1……w1_m,s2的分詞結(jié)果為w2_1……w2_n,首先檢驗w1_m與w2_n中是否恰有一個是已經(jīng)發(fā)現(xiàn)的術(shù)語,若w1_m是術(shù)語,則取s2作為術(shù)語候補,若w2_n是術(shù)語,則取s1作為術(shù)語候補;

步驟4.3:對步驟4.2中發(fā)現(xiàn)的術(shù)語候補tc,檢查分詞后所有與tc有整體部分關(guān)系的詞中術(shù)語所占的比例,若比例大于等于給定閾值則將tc設(shè)置為低置信度Rc加入到當(dāng)前術(shù)語候補集中;

步驟4.4:尋找出當(dāng)前術(shù)語候補集中滿足通過步驟4.1制定的模板的術(shù)語候補tc,并從中抽取“左部分”s1和“右部分”s2,若tc是高置信度術(shù)語候補,則設(shè)置s1為高置信度Rc,設(shè)置s2為高置信度Lc,當(dāng)tc是低置信度術(shù)語候補時,若tc為Lc則僅取s1,將其設(shè)置為低置信度Rc,否則僅取s2,將其設(shè)置為低置信度Lc,此后將tc從當(dāng)前術(shù)語候補集中刪除;

步驟4.5:將步驟4.4中產(chǎn)生的新術(shù)語候補添加到當(dāng)前術(shù)語候補集中;

步驟5:利用步驟1處理后得到的文本與步驟4生成的所述術(shù)語候補集,進(jìn)行基于并列關(guān)系的術(shù)語候補抽取,生成新的術(shù)語候補集,包括:

步驟5.1:人工根據(jù)文本特點總結(jié)出并列關(guān)系模板;

步驟5.2:通過步驟5.1制定的并列關(guān)系模板從利用步驟1處理后得到的文本中抽取出并列關(guān)系;

步驟5.3:設(shè)步驟5.2抽取出的并列內(nèi)容為s1……sn,sn的分詞結(jié)果w1……wm,設(shè)ti=wi……wm,其中1=i=m,計算機統(tǒng)計s1ti、……、sn-1ti,這n-1個字符串的出現(xiàn)次數(shù)之和Ti,設(shè)Ta為Ti中最大的值,此時對應(yīng)的ti為ta,若Ta大于給定閾值則將s1ta、……、sn-1ta、sn這n個詞語設(shè)置為高置信度Rc;

步驟5.4:計算機將步驟5.3中產(chǎn)生的術(shù)語候補添加到當(dāng)前術(shù)語候補集中;

步驟6:對步驟5生成的所述術(shù)語候補集中的每一個術(shù)語候補進(jìn)行基于構(gòu)詞規(guī)則的檢查,生成一個通過構(gòu)詞規(guī)則檢查的術(shù)語候補集,包括:

步驟6.1:人工對于一般術(shù)語的構(gòu)成進(jìn)行分析,總結(jié)出根據(jù)置信度高低不同的術(shù)語構(gòu)詞規(guī)則;

步驟6.2:根據(jù)步驟6.1得到的構(gòu)詞規(guī)則對當(dāng)前術(shù)語候補集中的術(shù)語候補進(jìn)行檢測,將所有滿足構(gòu)詞規(guī)則的術(shù)語候補添加到所述通過構(gòu)詞規(guī)則檢查的術(shù)語候補集中;

步驟6.3:對所述通過構(gòu)詞規(guī)則檢查的術(shù)語候補集中的每一個低置信度術(shù)語候補tc,檢查已經(jīng)發(fā)現(xiàn)的術(shù)語中是否存在一個術(shù)語t使得t為tc的后綴,若不存在這樣的t,則將tc從所述通過構(gòu)詞規(guī)則檢查的術(shù)語候補集中剔除;

步驟6.4:計算機對所述通過構(gòu)詞規(guī)則檢查的術(shù)語候補集中的每一個低置信度術(shù)語候補tc,計算tc在文本當(dāng)中的出現(xiàn)次數(shù),若小于給定閾值則將tc從所述通過構(gòu)詞規(guī)則檢查的術(shù)語候補集中剔除;

步驟7:利用步驟5生成的所述術(shù)語候補集和步驟6生成的所述通過構(gòu)詞規(guī)則檢查的術(shù)語候補集對術(shù)語候補進(jìn)行邊界檢測,生成新的術(shù)語集,包括:

步驟7.1:人工構(gòu)建邊界詞表;

步驟7.2:根據(jù)步驟7.1得到的邊界詞表以及當(dāng)前術(shù)語候補集和所述通過構(gòu)詞規(guī)則檢查的術(shù)語候補集,進(jìn)行術(shù)語邊界檢測;

步驟8:統(tǒng)計步驟7生成的所述術(shù)語集的元素個數(shù)為n,將n與步驟7執(zhí)行前的術(shù)語集的元素個數(shù)進(jìn)行比較,若二者相等則程序結(jié)束,返回當(dāng)前的術(shù)語集;否則,執(zhí)行步驟9;

步驟9:計算機修正分詞結(jié)果,返回至步驟3,包括:

步驟9.1:設(shè)t為術(shù)語集中的一個術(shù)語字符串,當(dāng)前分詞系統(tǒng)將其分為n個詞:w1、……、wn,其對應(yīng)的詞性為p1、……、pn,將t作為新詞添加到分詞系統(tǒng)中,使其分詞結(jié)果為一個詞,若pn為名詞類n、形容詞類a或動詞類v,則t的詞性與pn相同,否則設(shè)置t的詞性為名詞類n;

步驟9.2:更新當(dāng)前全部的分詞結(jié)果,重新計算所有詞的詞頻,跳轉(zhuǎn)到步驟3。

下載完整專利技術(shù)內(nèi)容需要扣除積分,VIP會員可以免費下載。

該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于清華大學(xué),未經(jīng)清華大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服

本文鏈接:http://www.szxzyx.cn/pat/books/201710833633.4/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。

×

專利文獻(xiàn)下載

說明:

1、專利原文基于中國國家知識產(chǎn)權(quán)局專利說明書;

2、支持發(fā)明專利 、實用新型專利、外觀設(shè)計專利(升級中);

3、專利數(shù)據(jù)每周兩次同步更新,支持Adobe PDF格式;

4、內(nèi)容包括專利技術(shù)的結(jié)構(gòu)示意圖流程工藝圖技術(shù)構(gòu)造圖;

5、已全新升級為極速版,下載速度顯著提升!歡迎使用!

請您登陸后,進(jìn)行下載,點擊【登陸】 【注冊】

關(guān)于我們 尋求報道 投稿須知 廣告合作 版權(quán)聲明 網(wǎng)站地圖 友情鏈接 企業(yè)標(biāo)識 聯(lián)系我們

鉆瓜專利網(wǎng)在線咨詢

周一至周五 9:00-18:00

咨詢在線客服咨詢在線客服
tel code back_top
主站蜘蛛池模板: 精品videossexfreeohdbbw| 日韩精品久久一区二区三区| 国产无套精品久久久久久| 午夜三级大片| 亚洲欧美国产日韩色伦| 色婷婷精品久久二区二区6| 国产精品一区二区毛茸茸| 欧美日本一二三区| 午夜精品一区二区三区在线播放| 国产午夜精品免费一区二区三区视频 | 激情久久综合网| 日韩三区三区一区区欧69国产| 狠狠躁夜夜av| 狠狠色综合欧美激情| 香蕉av一区二区| 久久99精品国产麻豆婷婷洗澡 | 国产天堂第一区| 欧美色综合天天久久| 狠狠色噜噜狠狠狠狠88| 国产一区免费在线| 欧美激情综合在线| 伊人av中文av狼人av| 亚洲国产偷| 午夜av影视| 99国产午夜精品一区二区天美| 日韩精品久久久久久久的张开腿让 | 欧美高清极品videossex| 狠狠色成色综合网| 日日夜夜精品免费看| 偷拍区另类欧美激情日韩91| 亚洲欧美国产中文字幕| 国产在线视频二区| 国产99视频精品免视看芒果| 欧美精品中文字幕在线观看| 国产精品久久久久久亚洲调教| 久久夜色精品亚洲噜噜国产mv| 久久午夜精品福利一区二区| 国产中文字幕一区二区三区 | 国产精品天堂| 久久久久国产亚洲| 69精品久久| 91精品夜夜| 免费xxxx18美国| 国产精品日韩在线观看| 日韩精品免费一区二区夜夜嗨| 亚洲欧美色图在线| 精品福利一区| 欧美一区二区三区久久久久久桃花| 国产精品午夜一区二区| 午夜影院91| 久久免费视频99| 国产1区在线观看| 夜夜精品视频一区二区| 91久久国产露脸精品国产 | 精品99免费视频| 大桥未久黑人强制中出| 国产精品区一区二区三| 免费看农村bbwbbw高潮| 国产午夜精品一区二区三区四区| 国产精品久久久久久久久久久久久久久久| 91免费国产视频| 日本精品一二三区| 欧美一区二区三区性| 99日韩精品视频| 色妞妞www精品视频| 精品久久久久久中文字幕| 日本二区在线播放| 国产精品99一区二区三区| 国产特级淫片免费看| 亚洲精品一区二区三区98年| 国产欧美一区二区在线观看| 91一区在线观看| 国产电影精品一区二区三区| 国产精品综合在线观看| 国产精品二区在线| 精品99在线视频| 久久福利免费视频| 91久久香蕉| 欧美一区二区免费视频| 综合久久一区| 午夜剧场a级免费| 国产三级在线视频一区二区三区| 26uuu亚洲电影在线观看| 精品欧美一区二区在线观看| 久久99久久99精品蜜柚传媒| 国产精品白浆视频| 欧美一区二区三区三州| 日本精品一区视频| 狠狠色丁香久久婷婷综合_中| 色婷婷久久一区二区三区麻豆| 91精品啪在线观看国产线免费| 国产精品天堂| 日韩av在线播| 91嫩草入口| 99三级视频| 91久久精品国产亚洲a∨麻豆 | 国产一区二区中文字幕| 岛国精品一区二区| 国产精品久久国产三级国电话系列 | 亚洲午夜国产一区99re久久| 国产欧美一区二区三区在线看| 国产一区www| 天干天干天啪啪夜爽爽99| 中出乱码av亚洲精品久久天堂| 亚洲一区2区三区| 国产伦精品一区二区三区照片91| 国产一区二区三区小说| 狠狠色噜噜狠狠狠狠88| 国产一区二区在线观| 99国产精品九九视频免费看| 国产女性无套免费看网站| 91久久免费| 久久艹国产精品| 伊人av综合网| 狠狠色噜噜狠狠狠狠米奇7777| 国产日韩区| 大bbw大bbw超大bbw| 91精品一区二区中文字幕| 久久精品色欧美aⅴ一区二区| 九九久久国产精品| 午夜电影理伦片2023在线观看| 欧美色综合天天久久| 理论片午午伦夜理片在线播放 | 福利电影一区二区三区| 欧美午夜精品一区二区三区| 99精品国产一区二区三区麻豆 | 日本一区二区三区免费视频| 日韩av在线一区| 一本色道久久综合亚洲精品图片 | 视频国产一区二区| 日本一区二区三区免费播放| 国产精品香蕉在线的人| 日韩av片无码一区二区不卡电影| 国产日韩欧美精品一区二区| 91精品视频免费在线观看| 99国产精品丝袜久久久久久| 国产麻豆91视频| 国产视频一区二区在线播放| 99国产精品永久免费视频 | 欧美乱妇在线视频播放| 久久久久久久久亚洲精品| 国产91精品一区二区麻豆亚洲| 午夜国产一区二区三区四区| 热久久一区二区| 午夜欧美影院| 欧美日韩一级二级三级| 久久久精品中文| 色一情一交一乱一区二区三区| 97涩国一产精品久久久久久久| 国产欧美二区| 亚洲乱子伦| 99爱精品在线| 欧美精品一区免费| 91久久久久久亚洲精品禁果| 日本一区二区高清| 羞羞视频网站免费| 欧美视屏一区| 午夜免费一级片| 国产精品视频一区二区二| 在线观看欧美日韩国产| 国产精品久久久不卡| 亚洲国产精品区| 香港三日三级少妇三级99| 91国偷自产一区二区介绍| 免费毛片a| 日韩精品一区二区免费| 国产丝袜一区二区三区免费视频| 日本神影院一区二区三区| 婷婷嫩草国产精品一区二区三区| 国产精品电影免费观看| 国产有码aaaae毛片视频| 午夜国产一区二区| 欧美乱码精品一区二区| 挺进警察美妇后菊| 鲁丝一区二区三区免费| а√天堂8资源中文在线| 国产精品久久久久99| 日韩精品一区在线观看| 午夜情所理论片| 爱看av在线入口| 91超碰caoporm国产香蕉| 一区二区三区欧美在线| 91性高湖久久久久久久久_久久99| 99精品视频一区二区| 欧美激情在线一区二区三区| 国产品久久久久久噜噜噜狼狼| 99精品国产99久久久久久97| 国产精品日韩一区二区三区| 欧美3级在线| 亚洲精品乱码久久久久久国产主播| 日韩欧美一区二区久久婷婷| 狠狠色狠狠色很很综合很久久| 99热久久这里只精品国产www | 国产91在线拍偷自揄拍 | 亚洲国产欧美一区| 国产精品69av| 国产91色综合| 亚洲乱亚洲乱妇28p| 免费毛片**| 久久影视一区二区| 亚洲va久久久噜噜噜久久0| 国产老妇av| 国产欧美日韩精品一区二区图片| 欧美高清性xxxxhdvideos| 国产精品96久久久久久又黄又硬| 国产日韩欧美中文字幕| 国产在线欧美在线| 性欧美1819sex性高播放| 国产一区二区三区在线电影| 欧美高清一二三区| 日韩av中文字幕在线免费观看| 国语对白一区二区三区| 色一情一乱一乱一区99av白浆| 国产99久久久久久免费看| 7777久久久国产精品 | 911久久香蕉国产线看观看| 一区二区国产精品| 国产日韩欧美色图| 国产精品一卡二卡在线观看| 一本色道久久综合亚洲精品浪潮| 国产一区二区三区小说| 香蕉av一区| 中文字幕日韩有码| 97久久精品人人做人人爽50路| 国产色99| 婷婷嫩草国产精品一区二区三区| 精品一区二区超碰久久久| 国产一区二区播放| 免费看大黄毛片全集免费| 日韩精品久久久久久久酒店| 99精品国产一区二区三区麻豆| 国产丝袜一区二区三区免费视频| 精品福利一区二区| 亚洲精品一品区二品区三品区| 国产在线观看免费麻豆| 福利电影一区二区三区| 中文在线一区| 日本边做饭边被躁bd在线看 | 97精品久久久午夜一区二区三区| 国产午夜一级一片免费播放| 91亚洲欧美强伦三区麻豆| 日本一区二区高清| 中文天堂在线一区| 久久国产这里只有精品| 久久久人成影片免费观看| 久久99精品国产麻豆婷婷|