[發明專利]事件抽取方法、裝置、系統和存儲介質有效
| 申請號: | 201710530618.2 | 申請日: | 2017-07-03 |
| 公開(公告)號: | CN107562772B | 公開(公告)日: | 2020-03-24 |
| 發明(設計)人: | 吳剛 | 申請(專利權)人: | 南京柯基數據科技有限公司 |
| 主分類號: | G06F16/31 | 分類號: | G06F16/31;G06F16/34;G06F16/35;G06F40/205;G06F40/211;G06F40/289;G06F40/295 |
| 代理公司: | 北京東方億思知識產權代理有限責任公司 11258 | 代理人: | 賀琳 |
| 地址: | 211100 江蘇省南*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 事件 抽取 方法 裝置 系統 存儲 介質 | ||
本發明公開了一種事件抽取方法、裝置、系統和存儲介質。該方法包括:利用對語料庫進行模式學習得到的觸發詞,定位語料庫的文檔中的事件句,并根據觸發詞的關系分類確定事件句的事件類別;使用模式學習得到的模式,模式匹配事件句,得到與模式相匹配的事件句集;根據預設的與事件類別對應的事件學習模板,抽取事件句集中的事件內容。根據本發明實施例提供的事件抽取方法,可以提高事件內容抽取的效率和完整性。
技術領域
本發明涉及信息抽取領域,尤其涉及事件抽取方法、裝置、系統和存儲介質。
背景技術
作為信息抽取的重要組成部分,事件抽取具有廣闊的應用前景和巨大的現實意義,并且在自動文摘、自動問答、情報研究和信息檢索等領域有著廣泛的應用。事件抽取的主要目的是把包含事件的非結構化文本以結構化的形式呈現出來。
事件抽取通常可以分為元事件(Meta Event)抽取和主題事件(Topic Event)抽取。其中,元事件表示一個動作的發生或者狀態的變化,包括參與該動作的一系列成分例如時間、地點、主體和客體等。元事件是主題事件的基本組成單位。
事件抽取是信息處理領域的關鍵技術,目前事件抽取的主要方法包括基于模式匹配的元事件抽取?;谀J狡ヅ浞椒▽κ录淖R別和抽取是在一些模式的指導下完成的,抽取時需要通過模式匹配算法找出符合模式約束條件的信息即可。
但是,基于模式匹配方法需要大量的人工建立模式,模式的創建者需要較高的技能水平。隨著互聯網技術的發展,WEB文本不斷豐富,面對大規模語料,人工建立模式的數量較大,使用模式匹配的方法顯得費時費力,且人工建立的模式往往比較片面且不夠準確,從而可能導致抽取的事件內容不夠完整和準確。
發明內容
本發明實施例提供事件抽取方法、裝置、系統和存儲介質,可以提高事件內容抽取的效率和完整性。
根據本發明實施例的一方面,提供一種事件抽取方法,包括:利用對語料庫進行模式學習得到的觸發詞,定位語料庫的文檔中的事件句,并根據觸發詞的關系分類確定事件句的事件類別;使用模式學習得到的模式,模式匹配事件句,得到與模式相匹配的事件句集;根據預設的與事件類別對應的事件學習模板,抽取事件句集中的事件內容。
根據本發明實施例的另一方面,提供一種事件抽取裝置,包括:事件句定位及分類模塊,用于利用對語料庫進行模式學習得到的觸發詞,定位語料庫的文檔中的事件句,并根據觸發詞的關系分類確定事件句的事件類別;事件句匹配模塊,用于使用模式學習得到的模式,模式匹配事件句,得到與模式相匹配的事件句集;事件內容抽取模塊,用于根據預設的與事件類別對應的事件學習模板,抽取事件句集中的事件內容。
根據本發明實施例的再一方面,提供一種事件抽取系統,包括:存儲器,用于儲存可執行程序代碼;處理器,用于讀取存儲器中存儲的可執行程序代碼以執行上述的事件抽取方法。
根據本發明實施例的又一方面,提供一種計算機可讀存儲介質,該計算機可讀存儲介質包括指令,當該指令在計算機上運行時,使得計算機執行上述各方面所述的方法。
根據本發明實施例的事件抽取方法、裝置、系統和存儲介質,利用模式學習得到的觸發詞定位所述語料庫的文檔中的事件句并對定位到的事件分類;并利用學習得到的模式,對定位到的事件句進行模式匹配,根據每種事件類別對應的事件學習模板學習事件內容。根據本發明實施例的事件抽取方法,在學習到新模式之后使用模式和模板學習結合的方式從文本中抽取相關的內容,提高了事件識別的效率,有利于提高事件識別的完整性和準確性。
附圖說明
為了更清楚地說明本發明實施例的技術方案,下面將對本發明實施例中所需要使用的附圖作簡單地介紹,對于本領域普通技術人員來講,在不付出創造性勞動的前提下,還可以根據這些附圖獲得其他的附圖。
圖1是示出根據本發明一實施例的事件抽取方法的流程圖;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于南京柯基數據科技有限公司,未經南京柯基數據科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710530618.2/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種數據處理過程動態回溯追蹤方法
- 下一篇:刮水片裝置





