[發明專利]一種基于分層策略網絡的事件抽取方法及設備在審
| 申請號: | 202110022760.2 | 申請日: | 2021-01-08 |
| 公開(公告)號: | CN112836504A | 公開(公告)日: | 2021-05-25 |
| 發明(設計)人: | 趙翔;黃培馨;譚真;胡升澤;肖衛東;胡艷麗;張軍;李碩豪 | 申請(專利權)人: | 中國人民解放軍國防科技大學 |
| 主分類號: | G06F40/284 | 分類號: | G06F40/284;G06N3/08;G06N3/04;G06K9/62 |
| 代理公司: | 長沙大珂知識產權代理事務所(普通合伙) 43236 | 代理人: | 伍志祥 |
| 地址: | 410073 湖*** | 國省代碼: | 湖南;43 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 分層 策略 網絡 事件 抽取 方法 設備 | ||
1.一種基于分層策略網絡的事件抽取方法,其特征在于,包括以下步驟:
步驟1,構建分層策略網絡,所述的分層策略網絡包括事件級策略網絡、論元級策略網絡和角色級決策網絡;
步驟2,在從句子頭向句子尾掃描的過程中,所述的事件級策略網絡在每個分詞處檢測觸發詞并且對檢測出來的觸發詞分類事件類型;
步驟3,一旦一個特定的事件被檢測出來,所述的論元級策略網絡將被觸發,開始從頭到尾掃描句子,以檢測當前這個事件的參與論元;
步驟4,一旦一個論元被識別出來,角色級策略網絡將被觸發,以預測當前事件下,這個論元在事件中扮演的角色;
步驟5,當角色級策略網絡角色分類完成,論元級策略網絡會繼續掃描之后的句子來尋找下一個論元,一旦當前事件下的論元級策略網絡完成論元檢測,事件級的策略網絡將繼續從當前事件的分詞處往后掃描句子來檢測句子包含的其他事件直到掃描到句子尾。
2.根據權利要求1所述的一種基于分層策略網絡的事件抽取方法,其特征在于,采用智能體進行上述步驟2-5的執行,步驟2中,當智能體從頭到尾順序掃描句子時,所述的事件級策略網絡在每個時間步持續根據策略來對選擇進行采樣,事件級選擇通常包括非觸發詞或者觸發詞的特定事件類型集合;
步驟3中,一個特定的事件被檢測到,智能體將會轉移至所述的論元級策略網絡,從頭到尾掃描句子時,在每個時間步根據策略來選擇一個行動,論元級行動是對分詞賦予一個特定的論元標簽;
步驟4中,一個特定的論元被檢測出,智能體會轉移至角色級網絡對當前論元根據策略采樣選擇,角色級選擇是角色類型的集合;
步驟5中,當論元的角色分類完成后,智能體會轉移至論元級策略網絡繼續掃描句子剩余的分詞識別事件的其余論元,一旦當前事件下智能體結束對當前事件的參與論元的檢測,智能體將會轉移至事件級策略網絡繼續掃描剩下的句子識別其他的事件;
在步驟2-5中,一旦一個選擇或行動被采樣到,就會有一個獎勵被返回。
3.根據權利要求2所述的一種基于分層策略網絡的事件抽取方法,其特征在于,給定輸入文本S=w1,w2,...,wL,所述的事件級策略網絡的目的是檢測觸發詞wi所觸發的事件類型,在當前詞或時間步t處,事件級策略網絡會采取隨機策略μ來確定選擇,然后使用獲得的獎勵來引導策略網絡的策略學習;
所述的事件級策略網絡的選擇是從一個選擇集合Oe={NE}∪ε中采樣得來,其中NE代表非觸發詞的分詞,ε是數據集中預先定義好的事件類型集合,用于指示當前觸發詞所觸發的事件類型;
所述的事件級策略網絡過程的狀態是與過去時間步相關的,不僅編碼當前輸入,還編碼了先前的環境狀態,是以下三個向量的聯結:1)上一時間步的狀態st-1,其中如果智能體在時間步t-1發起了事件級策略過程,則st-1=st-1e;否則st-1=st-1r,st-1e表示t-1時間步事件級策略網絡的環境狀態,st-1r表示t-1時間步角色級策略網絡的環境狀態,2)事件類型向量是從滿足的上一個選擇學習而來,3)隱層狀態向量ht,它是在當前輸入詞向量wt上進行Bi-LSTM獲得的隱層狀態向量,通過Bi-LSTM處理文本分詞序列得到:
由此,表示為:
最后,使用多層感知器MLP將狀態表示為一個連續的實值向量
所述的事件級策略網絡中的隨機策略,即進行某個選擇的策略,μ:Se→Oe,它采樣一個選擇根據如下的概率分布:
其中,We和be是參數,是狀態表示向量;
所述的事件級策略網絡的獎勵最終的目的是識別和分類事件,觸發詞正確與否是中間結果,一旦事件級選擇被采樣,智能體將獲得一個即時的獎勵,這個獎勵能夠反映在選擇下的短期回報,即時獎勵通過對比句子S中事件類型的標準注釋得到:
其中sgn(·)是符號函數,I(NE)是一個用來區分觸發詞和非觸發詞的獎勵的開關函數:
其中α是偏置權重,α<1,α越小,識別出非觸發詞獲得的獎勵更小,這能夠避免模型學習到不重要的策略,去將所有的詞都預測為NE,即非觸發詞;
當事件級策略網絡采樣選擇直至句子S中的最后一個詞,智能體結束所有事件級選擇之后,會獲得一個最終獎勵這個最終狀態的延遲reward由句子級事件檢測表現定義:
其中F1(·)表示句子級事件檢測結果的F1分數,是句子級精確率和召回率的調和平均值。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國人民解放軍國防科技大學,未經中國人民解放軍國防科技大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110022760.2/1.html,轉載請聲明來源鉆瓜專利網。





