[發明專利]一種對突發事件的實體信息進行抽取的方法與設備在審
| 申請號: | 202011158657.2 | 申請日: | 2020-10-26 |
| 公開(公告)號: | CN112182346A | 公開(公告)日: | 2021-01-05 |
| 發明(設計)人: | 不公告發明人 | 申請(專利權)人: | 上海蜜度信息技術有限公司 |
| 主分類號: | G06F16/953 | 分類號: | G06F16/953;G06F16/28;G06F40/279;G06F16/35;G06N3/04;G06N3/08 |
| 代理公司: | 上海百一領御專利代理事務所(普通合伙) 31243 | 代理人: | 王奎宇;甘章乖 |
| 地址: | 201204 上海市浦東新區自*** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 突發事件 實體 信息 進行 抽取 方法 設備 | ||
本申請的目的是提供一種用于提取突發事件信息中的實體信息的方法與設備。與現有技術相比,本申請通過確定用以進行實體信息提取的突發事件信息,然后,抽取所述突發事件信息中的候選實體信息,其中,所述候選實體信息包括用以描述所述突發事件信息的一個或多個事件元素信息,并將所述候選實體信息與所述突發事件信息進行內容關系識別,將滿足內容關系識別閾值的候選實體信息確定為所述突發事件的實體信息。通過這種方式,能夠方便快捷地實現對突發事件信息中的實體信息進行抽取,提高了效率。
技術領域
本申請涉及計算機技術領域,尤其涉及一種用于對突發事件的實體信息進行抽取的技術。
背景技術
現有技術中,事件抽取指的是,從自然語言文本中抽取出用戶感興趣的事件信息,并且以結構化的形式呈現出來,如什么人/組織,在什么時間,在什么地方,做了什么事情,可以將這些信息稱為事件的實體信息。對于事件抽取現有技術的方案主要包括:1)模式匹配方式,主要根據語言的模式,設計模板,將待抽取的句子和已有的模板進行匹配。通常基于語法樹或者正則表達式;2)基于管道式/流水線式的機器學習方法,主要通過把任務轉化為多階段分類任務;3)基于聯合建模式的機器學習方法,主要通過將任務轉化為依存樹結構的預測問題,把觸發詞提取和元素提取聯合在一個端到端的模型中。
上述現有技術中的方式主要用于通常的事件抽取中,而且,方法較繁瑣,且并未有針對突發事件的專門提取方式。在此,突發事件包括一些緊急或者突然發生的事件,例如,火災、地震、交通事故等等。因此,如何提供一種適用于突發事件的提取方式成為亟待解決的問題。
發明內容
本申請的目的是提供一種基于對突發事件的實體信息進行抽取的方法與設備,以解決現有技術中抽取方法太繁瑣的問題。
根據本申請的一個方面,提供了一種用于提取突發事件信息中的實體信息的方法,其中,所述方法包括:
確定用以進行實體信息提取的突發事件信息;
抽取所述突發事件信息中的候選實體信息,其中,所述候選實體信息包括用以描述所述突發事件信息的一個或多個事件元素信息;
將所述候選實體信息與所述突發事件信息進行內容關系識別,將滿足內容關系識別閾值的候選實體信息確定為所述突發事件的實體信息。
進一步地,其中,所述確定用以進行實體信息提取的突發事件信息包括:
獲取網絡平臺中的發布信息;
從所述發布信息中確定用以進行實體信息提取的突發事件信息。
進一步地,其中,所述從所述發布信息中確定用以進行實體信息提取的突發事件信息包括:
從所述發布信息中篩選包含突發事件信息觸發詞的目標發布信息;
通過二分類神經網絡模型對所述目標發布信息進行二分類判斷,將滿足突發事件閾值的目標發布信息確定為突發事件信息,其中,所述二分類神經網絡模型基于突發事件信息訓練數據訓練完成。
進一步地,其中,當所述突發事件信息包括含有多個觸發詞的多種突發事件信息,所述二分類神經網絡模型基于所述多種突發事件信息對應的多個突發事件信息訓練數據訓練完成,其中,通過二分類神經網絡模型對所述目標發布信息進行二分類判斷,將滿足突發事件閾值的目標發布信息確定為突發事件信息包括:
通過二分類神經網絡模型對所述目標發布信息進行二分類判斷,將滿足對應的突發事件閾值的目標發布信息確定為對應的突發事件信息。
進一步地,其中,所述二分類神經網絡模型包括attention based bi-lstm模型。
進一步地,其中,所述將所述候選實體信息與所述突發事件信息進行內容關系識別,將滿足內容關系識別閾值的候選實體信息確定為所述突發事件的實體信息包括:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于上海蜜度信息技術有限公司,未經上海蜜度信息技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011158657.2/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種火電廠用灰塵輔助搬運裝置
- 下一篇:一種多向可調式管道限位裝置
- 信息記錄介質、信息記錄方法、信息記錄設備、信息再現方法和信息再現設備
- 信息記錄裝置、信息記錄方法、信息記錄介質、信息復制裝置和信息復制方法
- 信息記錄裝置、信息再現裝置、信息記錄方法、信息再現方法、信息記錄程序、信息再現程序、以及信息記錄介質
- 信息記錄裝置、信息再現裝置、信息記錄方法、信息再現方法、信息記錄程序、信息再現程序、以及信息記錄介質
- 信息記錄設備、信息重放設備、信息記錄方法、信息重放方法、以及信息記錄介質
- 信息存儲介質、信息記錄方法、信息重放方法、信息記錄設備、以及信息重放設備
- 信息存儲介質、信息記錄方法、信息回放方法、信息記錄設備和信息回放設備
- 信息記錄介質、信息記錄方法、信息記錄裝置、信息再現方法和信息再現裝置
- 信息終端,信息終端的信息呈現方法和信息呈現程序
- 信息創建、信息發送方法及信息創建、信息發送裝置





