[發明專利]基于強化學習的事件論元抽取方法及裝置有效
| 申請號: | 202010552821.1 | 申請日: | 2020-06-17 |
| 公開(公告)號: | CN111797241B | 公開(公告)日: | 2023-08-22 |
| 發明(設計)人: | 張世琨;葉蔚;習翔宇;張君福;胡文蕙;劉學洋 | 申請(專利權)人: | 北京北大軟件工程股份有限公司 |
| 主分類號: | G06F16/36 | 分類號: | G06F16/36;G06F16/35 |
| 代理公司: | 北京細軟智谷知識產權代理有限責任公司 11471 | 代理人: | 譚承世 |
| 地址: | 100089 北京市海淀區北四環西路67號中關*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 強化 學習 事件 抽取 方法 裝置 | ||
本發明涉及一種基于強化學習的事件論元抽取方法及裝置,包括構建事件檢測模型,構建論元檢測模型,構建實體選擇模型,將實體選擇模型選擇的待檢測實體輸入到論元檢測模型進行檢測,采集預測結果的損失,根據預測結果的損失更新論元檢測模型的參數;根據待檢測實體更新實體選擇模型;通過更新后的論元檢測模型和更新后的實體選擇模型對句子中的實體進行檢測,并將檢測結果引入更新后的論元檢測模型和更新后的實體選擇模型進行更新,循環直至遍歷所有實體。本發明能夠在檢測當前論元的時候,引入已知論元的信息,通過引入已知論元信息和強化學習技術,能夠有效利用論元間交互關系,提高論元檢測效果。
技術領域
本發明屬于自然語言技術領域,具體涉及一種基于強化學習的事件論元抽取方法及裝置。
背景技術
信息抽取是通過自然語言處理等方法將人類可讀的非結構化文本轉化為機器可讀的結構化文本,特別是從文本中識別和抽取出用戶感興趣的實體、事件和實體關系等,并將結果以結構化的形式存儲,例如關系數據庫或者XML,為數據分析、查詢等應用提供數據。其中事件抽取是一個重要且難度較高的任務。事件抽取是把含有事件信息的非結構化文本中的事件信息以結構化的形式呈現出來,包括識別事件觸發詞和事件相關論元。事件抽取在自動文摘、自動問答、信息檢索、知識圖譜等領域有著廣泛的應用。
近年來,事件抽取受到了各國學者的廣泛關注,并且產生了大量優秀的研究成果和應用。按照事件抽取技術來區分,可以分為兩大類:
1、傳統機器學習方式;在2014年及以前,事件抽取以傳統機器學習方法為主,主要包括基于特征的方式和基于結構的方式。傳統機器學習方式通常依賴于手工設計的特征和語言學知識,通常需要使用外部工具來生成特征,例如詞性標注、實體標注、句法依存分析等特征;使用外部工具程序復雜,實現困難;
2、深度學習方式;2015年及以后,深度學習被逐漸引入到事件抽取中,也取得了超越傳統機器學習方法的效果。基于深度學習的方式通常采用深度學習算法例如CNN、RNN、DMCNN、JRNN、DBRNN以及各種Attention機制等來對特征進行自動抽取,并進行分類。
但是,現有的事件抽取工作通常將論元抽取建模為針對實體和相關事件的論元角色分類任務,并且針對一個句子中實體集合的每個實體分離地進行訓練與測試,忽略了候選論元之間潛在的交互關系,導致論元檢測效果不顯著。
發明內容
有鑒于此,本發明的目的在于克服現有技術的不足,提供一種基于強化學習的事件論元抽取方法及裝置,以解決現有技術中忽略了候選論元之間潛在的交互關系,導致論元檢測效果不顯著的問題。
為實現以上目的,本發明采用如下技術方案:一種基于強化學習的事件論元抽取方法,包括:
構建事件檢測模型,所述事件檢測模型檢測句子中的觸發詞并根據所述觸發詞進行事件類型預測;其中,所述句子包括觸發詞和實體;
構建論元檢測模型,所述論元檢測模根據預測的事件類型對事件的每個觸發詞和每個實體兩兩之間進行論元檢測;
構建實體選擇模型,所述實體選擇模型從未檢測的實體集合中確定待檢測實體;
將所述實體選擇模型選擇的待檢測實體輸入到所述論元檢測模型進行檢測,采集預測結果的損失,根據所述預測結果的損失更新所述論元檢測模型的參數;根據所述待檢測實體更新所述實體選擇模型;
通過更新后的論元檢測模型和更新后的實體選擇模型對所述句子中的實體進行檢測,并將檢測結果引入更新后的論元檢測模型和更新后的實體選擇模型進行更新,循環直至遍歷所有實體,確定并輸出論元集合。
進一步的,所述構建事件檢測模型,包括:
采用雙向長短期記憶條件隨機場模型對文本數據進行標注;
采用已標注文本數據對事件檢測模型進行訓練,直至收斂,輸出事件檢測模型。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京北大軟件工程股份有限公司,未經北京北大軟件工程股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010552821.1/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:光檢測器件及電子裝置
- 下一篇:光檢測器件及電子裝置





