日韩在线一区二区三区,日本午夜一区二区三区,国产伦精品一区二区三区四区视频,欧美日韩在线观看视频一区二区三区 ,一区二区视频在线,国产精品18久久久久久首页狼,日本天堂在线观看视频,综合av一区

[發(fā)明專利]一種融入約束信息的遠(yuǎn)程監(jiān)督關(guān)系抽取方法有效

專利信息
申請(qǐng)?zhí)枺?/td> 202110366544.X 申請(qǐng)日: 2021-04-06
公開(公告)號(hào): CN112860903B 公開(公告)日: 2022-02-22
發(fā)明(設(shè)計(jì))人: 劉揚(yáng);梁天銘;劉曉燕;劉國軍;王春宇;郭茂祖 申請(qǐng)(專利權(quán))人: 哈爾濱工業(yè)大學(xué)
主分類號(hào): G06F16/35 分類號(hào): G06F16/35;G06F16/36;G06F40/205;G06F40/30
代理公司: 哈爾濱華夏松花江知識(shí)產(chǎn)權(quán)代理有限公司 23213 代理人: 岳昕
地址: 150001 黑龍*** 國省代碼: 黑龍江;23
權(quán)利要求書: 查看更多 說明書: 查看更多
摘要:
搜索關(guān)鍵詞: 一種 融入 約束 信息 遠(yuǎn)程 監(jiān)督 關(guān)系 抽取 方法
【說明書】:

一種融入約束信息的遠(yuǎn)程監(jiān)督關(guān)系抽取方法,涉及自然語言處理技術(shù)領(lǐng)域,為了解決基于遠(yuǎn)程監(jiān)督的關(guān)系抽取中所出現(xiàn)的標(biāo)簽噪聲問題和長(zhǎng)尾關(guān)系問題,采用本申請(qǐng)?zhí)岢龅年P(guān)系抽取方法,可以通過引入實(shí)體類型信息和關(guān)系約束信息來豐富關(guān)系抽取模型的背景知識(shí),從而有效增強(qiáng)關(guān)系抽取模型在噪聲環(huán)境下的魯棒性和準(zhǔn)確率;另外還可以利用GCN的鄰居聚合機(jī)制,促進(jìn)信息在數(shù)據(jù)豐富的頭部關(guān)系和數(shù)據(jù)匱乏的長(zhǎng)尾關(guān)系之間的傳播,從而增強(qiáng)長(zhǎng)尾關(guān)系的表示學(xué)習(xí)。本申請(qǐng)能夠充分利用約束圖中的信息,同時(shí)解決遠(yuǎn)程監(jiān)督關(guān)系抽取中的標(biāo)簽噪聲問題和長(zhǎng)尾關(guān)系問題。

技術(shù)領(lǐng)域

發(fā)明涉及自然語言處理技術(shù)領(lǐng)域,具體為一種融入約束信息的遠(yuǎn)程監(jiān)督關(guān)系抽取方法。

背景技術(shù)

關(guān)系抽取是信息抽取的主要任務(wù)之一,它在命名實(shí)體識(shí)別的基礎(chǔ)上,致力于從非結(jié)構(gòu)化文本中提取出兩個(gè)既定實(shí)體之間的語義關(guān)系。關(guān)系抽取通常被建模為一個(gè)多分類問題,即給定一個(gè)實(shí)體對(duì)以及包含這個(gè)實(shí)體對(duì)的句子,判別這個(gè)實(shí)體對(duì)屬于哪一種預(yù)定義關(guān)系類別。

許多研究致力于使用有監(jiān)督學(xué)習(xí)來完成關(guān)系抽取任務(wù),而且已經(jīng)取得了一定的進(jìn)展。然而,有監(jiān)督的關(guān)系抽取方法依賴于大量的有標(biāo)注數(shù)據(jù),而數(shù)據(jù)的標(biāo)注需要耗費(fèi)極大的時(shí)間和人力成本。為了解決這個(gè)問題,“遠(yuǎn)程監(jiān)督”假設(shè)被提出:如果一個(gè)實(shí)體對(duì)在現(xiàn)有的知識(shí)庫中存在某個(gè)關(guān)系,那么所有提及了這個(gè)實(shí)體對(duì)的句子都在以不同的程度來表達(dá)這個(gè)關(guān)系。根據(jù)這個(gè)假設(shè),可以通過對(duì)齊文本和知識(shí)庫中的實(shí)體對(duì)來完成樣本的自動(dòng)標(biāo)注,從而迅速擴(kuò)大有標(biāo)注數(shù)據(jù)的規(guī)模。然而,基于遠(yuǎn)程監(jiān)督的關(guān)系抽取通常面臨著兩個(gè)主要的問題。

其一是標(biāo)簽噪聲問題,如果實(shí)體對(duì)在現(xiàn)有知識(shí)庫中存在某種關(guān)系,那么即使包含該實(shí)體對(duì)的句子中并沒有表達(dá)該關(guān)系,遠(yuǎn)程監(jiān)督也會(huì)將該句子標(biāo)注為該關(guān)系。

其二是長(zhǎng)尾關(guān)系問題。現(xiàn)實(shí)世界中的遠(yuǎn)程監(jiān)督數(shù)據(jù)集往往是長(zhǎng)尾的,即小部分的關(guān)系類別占據(jù)了大部分的訓(xùn)練樣本,而大部分的關(guān)系類別只有小部分的數(shù)據(jù)。即使是目前表現(xiàn)最好的關(guān)系抽取模型,仍然無法處理這些數(shù)據(jù)稀缺的長(zhǎng)尾關(guān)系。

因此,要將遠(yuǎn)程監(jiān)督關(guān)系抽取應(yīng)用于實(shí)際生產(chǎn)項(xiàng)目中,標(biāo)簽噪聲和長(zhǎng)尾關(guān)系都是迫切需要被解決的重要問題。

發(fā)明內(nèi)容

本發(fā)明的目的是:解決基于遠(yuǎn)程監(jiān)督的關(guān)系抽取中所出現(xiàn)的標(biāo)簽噪聲問題和長(zhǎng)尾關(guān)系問題,提出一種融入約束信息的遠(yuǎn)程監(jiān)督關(guān)系抽取方法。

本發(fā)明為了解決上述技術(shù)問題采取的技術(shù)方案是:

一種融入約束信息的遠(yuǎn)程監(jiān)督關(guān)系抽取方法,包括以下步驟:

步驟一、獲取包含噪聲標(biāo)簽的文本數(shù)據(jù)集;

步驟二、設(shè)定需要抽取的關(guān)系,并根據(jù)每種關(guān)系的頭尾實(shí)體類型約束規(guī)則構(gòu)建約束圖;

步驟三、將約束圖轉(zhuǎn)換為向量形式,并采用GCN構(gòu)建約束圖中關(guān)系和實(shí)體類型的向量表示;

步驟四、根據(jù)目標(biāo)實(shí)體對(duì)將包含噪聲標(biāo)簽的文本數(shù)據(jù)集中的句子分組為不同的句子袋;

步驟五、對(duì)于每個(gè)句子袋,采用PCNN構(gòu)建句子袋中每個(gè)句子的向量表示;

步驟六、根據(jù)約束圖中關(guān)系和實(shí)體類型的向量表示和句子袋中每個(gè)句子的向量表示計(jì)算句子袋中每個(gè)句子對(duì)于關(guān)系約束的權(quán)重值;

步驟七、根據(jù)得到的權(quán)重值,以句子袋中每條句子的向量加權(quán)和作為該句子袋的向量表示;

步驟八、根據(jù)句子袋的向量表示,采取Softmax分類器進(jìn)行預(yù)測(cè),得到該句子袋屬于每種關(guān)系的概率值。

進(jìn)一步的,所述步驟一中包含噪聲標(biāo)簽的文本數(shù)據(jù)集根據(jù)遠(yuǎn)程監(jiān)督假設(shè)通過對(duì)齊知識(shí)庫與無標(biāo)注文本中的實(shí)體對(duì)得到。

進(jìn)一步的,所述步驟二中構(gòu)建約束圖的具體步驟為:

下載完整專利技術(shù)內(nèi)容需要扣除積分,VIP會(huì)員可以免費(fèi)下載。

該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于哈爾濱工業(yè)大學(xué),未經(jīng)哈爾濱工業(yè)大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服

本文鏈接:http://www.szxzyx.cn/pat/books/202110366544.X/2.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。

×

專利文獻(xiàn)下載

說明:

1、專利原文基于中國國家知識(shí)產(chǎn)權(quán)局專利說明書;

2、支持發(fā)明專利 、實(shí)用新型專利、外觀設(shè)計(jì)專利(升級(jí)中);

3、專利數(shù)據(jù)每周兩次同步更新,支持Adobe PDF格式;

4、內(nèi)容包括專利技術(shù)的結(jié)構(gòu)示意圖、流程工藝圖技術(shù)構(gòu)造圖;

5、已全新升級(jí)為極速版,下載速度顯著提升!歡迎使用!

請(qǐng)您登陸后,進(jìn)行下載,點(diǎn)擊【登陸】 【注冊(cè)】

關(guān)于我們 尋求報(bào)道 投稿須知 廣告合作 版權(quán)聲明 網(wǎng)站地圖 友情鏈接 企業(yè)標(biāo)識(shí) 聯(lián)系我們

鉆瓜專利網(wǎng)在線咨詢

周一至周五 9:00-18:00

咨詢?cè)诰€客服咨詢?cè)诰€客服
tel code back_top
主站蜘蛛池模板: 精品久久久久久中文字幕大豆网 | 日本一区二区免费电影| 欧美日韩久久精品| 国产精品视频一二区| 国产精品1区二区| 亚洲精品中文字幕乱码三区91| 中文字幕在线播放一区| 99精品一级欧美片免费播放| 国产69精品久久久久777| 国产精品一区不卡| 午夜av免费观看| 欧美三级午夜理伦三级中视频 | 91麻豆精品一区二区三区| 国产资源一区二区| 国产精品一区二区麻豆| 亚洲精品久久久久中文字幕欢迎你| 日本高清一二三区| 亚洲欧美国产精品久久| 久久精品欧美一区二区| 国产精品欧美久久| 丰满岳乱妇bd在线观看k8| 国产99久久久久久免费看| 艳妇荡乳欲伦2| 国产乱对白刺激在线视频| 国产精品免费观看国产网曝瓜| 91精品高清| 精品国产区一区二| 久久久久国产精品免费免费搜索 | 国产原创一区二区| 欧美日韩一卡二卡| 99久久免费精品国产男女性高好| 久免费看少妇高潮a级特黄按摩| 国产精品综合久久| 午夜免费av电影| 亚洲欧美制服丝腿| 久久久久国产精品免费免费搜索| 日韩一区高清| 午夜影皖精品av在线播放| 日韩一区二区三区福利视频| 91久久一区二区| 亚洲精品久久在线| 国产精品麻豆自拍| 99精品黄色| 日韩免费一级视频| 免费a级毛片18以上观看精品| 高清欧美xxxx| 四虎国产精品永久在线国在线 | 久久第一区| 欧美一区二区三区在线免费观看| 欧美亚洲精品suv一区| 窝窝午夜精品一区二区| 久久99久久99精品免观看软件| 日韩美一区二区三区| 99国产精品| 亚洲乱亚洲乱妇50p| 久久久中精品2020中文| 好吊妞国产欧美日韩免费观看网站| 亚洲欧美另类久久久精品2019| 国产精品视频1区| 久久精品视频3| 在线视频国产一区二区| 国产二区免费| 日本边做饭边被躁bd在线看| 国产乱人伦精品一区二区| 国产欧美一区二区三区沐欲| 久久久久久亚洲精品| 国产一区在线免费观看| 久久久久久综合网| 国产一区二区三区午夜| 理论片高清免费理伦片| 午夜影院一区二区| 国产日韩一区二区在线| 日本丰满岳妇伦3在线观看| 午夜精品一区二区三区三上悠亚| 久久国产精久久精产国| 精品国产1区2区3区| 九九久久国产精品| 99国精视频一区一区一三| 精品三级一区二区| 国产69精品久久99不卡免费版| 日本精品在线一区| 日日噜噜夜夜狠狠|