[發明專利]一種對突發事件的實體信息進行抽取的方法與設備在審
| 申請號: | 202011158657.2 | 申請日: | 2020-10-26 |
| 公開(公告)號: | CN112182346A | 公開(公告)日: | 2021-01-05 |
| 發明(設計)人: | 不公告發明人 | 申請(專利權)人: | 上海蜜度信息技術有限公司 |
| 主分類號: | G06F16/953 | 分類號: | G06F16/953;G06F16/28;G06F40/279;G06F16/35;G06N3/04;G06N3/08 |
| 代理公司: | 上海百一領御專利代理事務所(普通合伙) 31243 | 代理人: | 王奎宇;甘章乖 |
| 地址: | 201204 上海市浦東新區自*** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 突發事件 實體 信息 進行 抽取 方法 設備 | ||
1.一種用于提取突發事件信息中的實體信息的方法,其中,所述方法包括:
確定用以進行實體信息提取的突發事件信息;
抽取所述突發事件信息中的候選實體信息,其中,所述候選實體信息包括用以描述所述突發事件信息的一個或多個事件元素信息;
將所述候選實體信息與所述突發事件信息進行內容關系識別,將滿足內容關系識別閾值的候選實體信息確定為所述突發事件的實體信息。
2.根據權利要求1所述的方法,其中,所述確定用以進行實體信息提取的突發事件信息包括:
獲取網絡平臺中的發布信息;
從所述發布信息中確定用以進行實體信息提取的突發事件信息。
3.根據權利要求2所述的方法,其中,所述從所述發布信息中確定用以進行實體信息提取的突發事件信息包括:
從所述發布信息中篩選包含突發事件信息觸發詞的目標發布信息;
通過二分類神經網絡模型對所述目標發布信息進行二分類判斷,將滿足突發事件閾值的目標發布信息確定為突發事件信息,其中,所述二分類神經網絡模型基于突發事件信息訓練數據訓練完成。
4.根據權利要求3所述的方法,其中,當所述突發事件信息包括含有多個觸發詞的多種突發事件信息,所述二分類神經網絡模型基于所述多種突發事件信息對應的多個突發事件信息訓練數據訓練完成,其中,通過二分類神經網絡模型對所述目標發布信息進行二分類判斷,將滿足突發事件閾值的目標發布信息確定為突發事件信息包括:
通過二分類神經網絡模型對所述目標發布信息進行二分類判斷,將滿足對應的突發事件閾值的目標發布信息確定為對應的突發事件信息。
5.根據權利要求3或4所述的方法,其中,所述二分類神經網絡模型包括attentionbased bi-lstm模型。
6.根據權利要求1至5中任一項所述的方法,其中,所述將所述候選實體信息與所述突發事件信息進行內容關系識別,將滿足內容關系識別閾值的候選實體信息確定為所述突發事件的實體信息包括:
將所述候選實體信息對應的一個或多個事件元素信息分別與所述突發事件信息或者所述突發事件信息對應的觸發詞輸入關系識別神經網絡模型,將滿足內容關系識別閾值的事件元素信息確定為所述突發事件的實體信息。
7.根據權利要求1至6中任一項所述的方法,其中,所述關系識別網絡模型包括attention-based rnn模型或者bert模型中至少任一項,其中,當所述關系識別網絡模型包括attention-based rnn模型和bert模型,其中,所述將所述候選實體信息與所述突發事件信息進行內容關系識別,將滿足內容關系識別閾值的候選實體信息確定為所述突發事件的實體信息包括:
將所述候選實體信息對應的一個或多個事件元素信息與所述突發事件信息分別輸入attention-based rnn模型和bert模型,將滿足至少一個所述模型的內容關系識別閾值的事件元素信息確定為所述突發事件的實體信息。
8.根據權利要求1至7任一項所述的方法,其中,所述突發事件信息的事件元素信息包括主體信息、時間信息和地點信息,其中,所述候選實體信息包括所述突發事件中涉及的所有主體信息、時間信息和地點信息,所述抽取所述突發事件信息中的候選實體信息包括:
通過baidulac工具抽取所述突發事件信息中的所有時間信息和地點信息并通過hanlp工具抽取所述突發事件信息中的所有主體信息;
將抽取的所有所述主體信息、時間信息和地點信息確定為所述突發事件信息中的候選實體信息。
9.一種計算機可讀介質,其上存儲有計算機可讀指令,所述計算機可讀指令可被處理器執行以實現如權利要求1至8中任一項所述的方法。
10.一種用于提取突發事件信息中的實體信息的設備,其中,該設備包括:
一個或多個處理器;以及
存儲有計算機可讀指令的存儲器,所述計算機可讀指令在被執行時使所述處理器執行如權利要求1至8中任一項所述方法的操作。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于上海蜜度信息技術有限公司,未經上海蜜度信息技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011158657.2/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種火電廠用灰塵輔助搬運裝置
- 下一篇:一種多向可調式管道限位裝置
- 信息記錄介質、信息記錄方法、信息記錄設備、信息再現方法和信息再現設備
- 信息記錄裝置、信息記錄方法、信息記錄介質、信息復制裝置和信息復制方法
- 信息記錄裝置、信息再現裝置、信息記錄方法、信息再現方法、信息記錄程序、信息再現程序、以及信息記錄介質
- 信息記錄裝置、信息再現裝置、信息記錄方法、信息再現方法、信息記錄程序、信息再現程序、以及信息記錄介質
- 信息記錄設備、信息重放設備、信息記錄方法、信息重放方法、以及信息記錄介質
- 信息存儲介質、信息記錄方法、信息重放方法、信息記錄設備、以及信息重放設備
- 信息存儲介質、信息記錄方法、信息回放方法、信息記錄設備和信息回放設備
- 信息記錄介質、信息記錄方法、信息記錄裝置、信息再現方法和信息再現裝置
- 信息終端,信息終端的信息呈現方法和信息呈現程序
- 信息創建、信息發送方法及信息創建、信息發送裝置





