[發(fā)明專利]基于強(qiáng)化學(xué)習(xí)的事件論元抽取方法及裝置有效
| 申請?zhí)枺?/td> | 202010552821.1 | 申請日: | 2020-06-17 |
| 公開(公告)號: | CN111797241B | 公開(公告)日: | 2023-08-22 |
| 發(fā)明(設(shè)計(jì))人: | 張世琨;葉蔚;習(xí)翔宇;張君福;胡文蕙;劉學(xué)洋 | 申請(專利權(quán))人: | 北京北大軟件工程股份有限公司 |
| 主分類號: | G06F16/36 | 分類號: | G06F16/36;G06F16/35 |
| 代理公司: | 北京細(xì)軟智谷知識產(chǎn)權(quán)代理有限責(zé)任公司 11471 | 代理人: | 譚承世 |
| 地址: | 100089 北京市海淀區(qū)北四環(huán)西路67號中關(guān)*** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 基于 強(qiáng)化 學(xué)習(xí) 事件 抽取 方法 裝置 | ||
1.一種基于強(qiáng)化學(xué)習(xí)的事件論元抽取方法,其特征在于,包括:
構(gòu)建事件檢測模型,所述事件檢測模型檢測句子中的觸發(fā)詞并根據(jù)所述觸發(fā)詞進(jìn)行事件類型預(yù)測;其中,所述句子包括觸發(fā)詞和實(shí)體;
構(gòu)建論元檢測模型,所述論元檢測模根據(jù)預(yù)測的事件類型對事件的每個(gè)觸發(fā)詞和每個(gè)實(shí)體兩兩之間進(jìn)行論元檢測;
構(gòu)建實(shí)體選擇模型,所述實(shí)體選擇模型從未檢測的實(shí)體集合中確定待檢測實(shí)體;根據(jù)當(dāng)前的環(huán)境信息,計(jì)算句子中所有實(shí)體被選擇進(jìn)行檢測的概率,將概率最高的實(shí)體確定為待檢測實(shí)體;
將所述實(shí)體選擇模型選擇的待檢測實(shí)體輸入到所述論元檢測模型進(jìn)行檢測,采集預(yù)測結(jié)果的損失,根據(jù)所述預(yù)測結(jié)果的損失更新所述論元檢測模型的參數(shù);根據(jù)所述待檢測實(shí)體更新所述實(shí)體選擇模型;
通過更新后的論元檢測模型和更新后的實(shí)體選擇模型對所述句子中的實(shí)體進(jìn)行檢測,并將檢測結(jié)果引入更新后的論元檢測模型和更新后的實(shí)體選擇模型進(jìn)行更新,循環(huán)直至遍歷所有實(shí)體,確定并輸出論元集合。
2.根據(jù)權(quán)利要求1所述的抽取方法,其特征在于,所述構(gòu)建事件檢測模型,包括:
采用雙向長短期記憶條件隨機(jī)場模型對文本數(shù)據(jù)進(jìn)行標(biāo)注;
采用已標(biāo)注文本數(shù)據(jù)對事件檢測模型進(jìn)行訓(xùn)練,直至收斂,輸出事件檢測模型。
3.根據(jù)權(quán)利要求1所述的抽取方法,其特征在于,所述構(gòu)建論元檢測模型,包括:
對所述論元檢測模型進(jìn)行預(yù)訓(xùn)練,采用從左往右遍歷的方式來選擇實(shí)體,采用真實(shí)的實(shí)體、論元角色信息作為特征。
4.根據(jù)權(quán)利要求1所述的抽取方法,其特征在于,所述構(gòu)建實(shí)體選擇模型,包括:
向所述實(shí)體選擇模型中輸入環(huán)境信息;
所述環(huán)境信息包括:句子信息、實(shí)體信息、所述實(shí)體信息包括實(shí)體類型、事件的觸發(fā)詞信息、所述觸發(fā)詞信息包括事件類型、已預(yù)測出的實(shí)體類別信息。
5.根據(jù)權(quán)利要求4所述的抽取方法,其特征在于,所述論元檢測模型,包括:
嵌入層,用于構(gòu)造事件的每個(gè)詞的向量表示,獲取詞向量;
卷積層,用于對所述詞向量進(jìn)行卷積操作;
池化層,用于對卷積操作后的詞向量進(jìn)行最大池化操作,獲取事件和實(shí)體構(gòu)成的二元組的向量表示;
分類層,用于采用全連接網(wǎng)絡(luò)和Softmax操作對實(shí)體向量屬于事件向量的角色進(jìn)行分類。
6.根據(jù)權(quán)利要求5所述的抽取方法,其特征在于,所述實(shí)體選擇模型,包括:
嵌入層,用于構(gòu)造事件的每個(gè)詞的向量表示;
雙向遞歸神經(jīng)網(wǎng)絡(luò)層,用于采用雙向遞歸結(jié)構(gòu)對所述嵌入層輸出的句子進(jìn)行表示并輸出;
事件信息增強(qiáng)層,用于將事件類別引入到所述雙向遞歸神經(jīng)網(wǎng)絡(luò)層的輸出中;
線性映射層,用于對事件信息增強(qiáng)層輸出的向量進(jìn)行矩陣乘法操作,并將操作后的字符映射到二維向量,表示實(shí)體被選擇進(jìn)行檢測的概率;
輸出層,用于屏蔽已經(jīng)選擇的實(shí)體的字符向量或者非實(shí)體的字符向量,選擇概率最大的實(shí)體。
7.根據(jù)權(quán)利要求1所述的抽取方法,其特征在于,
采用Adam優(yōu)化器更新論元檢測模型的參數(shù)。
8.根據(jù)權(quán)利要求5所述的抽取方法,其特征在于,
所述卷積層采用長度為3、數(shù)量為300的卷積核進(jìn)行操作。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于北京北大軟件工程股份有限公司,未經(jīng)北京北大軟件工程股份有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010552821.1/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 上一篇:光檢測器件及電子裝置
- 下一篇:光檢測器件及電子裝置
- 根據(jù)用戶學(xué)習(xí)效果動(dòng)態(tài)變化下載學(xué)習(xí)數(shù)據(jù)的系統(tǒng)及方法
- 用于智能個(gè)人化學(xué)習(xí)服務(wù)的方法
- 漸進(jìn)式學(xué)習(xí)管理方法及漸進(jìn)式學(xué)習(xí)系統(tǒng)
- 輔助學(xué)習(xí)的方法及裝置
- 基于人工智能的課程推薦方法、裝置、設(shè)備及存儲介質(zhì)
- 基于強(qiáng)化學(xué)習(xí)的自適應(yīng)移動(dòng)學(xué)習(xí)路徑生成方法
- 一種線上視頻學(xué)習(xí)系統(tǒng)
- 一種基于校園大數(shù)據(jù)的自適應(yīng)學(xué)習(xí)方法、裝置及設(shè)備
- 一種學(xué)習(xí)方案推薦方法、裝置、設(shè)備和存儲介質(zhì)
- 游戲?qū)W習(xí)效果評測方法及系統(tǒng)
- 一種事件通訊裝置及方法
- 動(dòng)態(tài)權(quán)重事件處理系統(tǒng)和方法
- 攻擊檢測裝置和攻擊檢測方法
- 基于Unity的事件管理方法及系統(tǒng)
- 事件解析裝置、事件解析系統(tǒng)、事件解析方法及事件解析程序
- 事件解析裝置、事件解析系統(tǒng)、事件解析方法及事件解析程序
- 事件解析裝置、事件解析系統(tǒng)、事件解析方法及事件解析程序
- 熱點(diǎn)事件確定方法及裝置、計(jì)算機(jī)設(shè)備及存儲介質(zhì)
- 一種樹狀模型中節(jié)點(diǎn)的連接方法及其模型、計(jì)算機(jī)裝置和可讀存儲介質(zhì)
- 一種事件處理方法、裝置、設(shè)備及存儲介質(zhì)





