[發明專利]一種關聯對象的獲取方法、介質及設備有效
| 申請號: | 202211534322.5 | 申請日: | 2022-12-02 |
| 公開(公告)號: | CN115544215B | 公開(公告)日: | 2023-03-31 |
| 發明(設計)人: | 劉羽;劉宸;傅曉航;張正義 | 申請(專利權)人: | 中科雨辰科技有限公司 |
| 主分類號: | G06F16/33 | 分類號: | G06F16/33;G06F40/289 |
| 代理公司: | 北京鍾維聯合知識產權代理有限公司 11579 | 代理人: | 安娜 |
| 地址: | 100093 北京*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 關聯 對象 獲取 方法 介質 設備 | ||
本發明提供了一種關聯對象的獲取方法、介質及設備,所述方法包括如下步驟:獲取初始對象列表和初始事件標簽集,獲取目標對象和目標對象對應的目標事件標簽,根據初始對象列表、初始事件標簽集、目標對象和目標對象對應的目標事件標簽,獲取目標對象對應的關鍵對象列表,獲取候選對象列表對應的候選事件標簽集,獲取候選事件標簽列表中不包括目標事件標簽的對應的候選對象作為目標對象的關鍵對象,根據目標對象對應的目標事件標簽和目標對象對應的關鍵對象列表獲取目標對象的關聯對象。本發明一方面,獲取與事件標簽不一致的事件,減少了可匹配對象的數據量,使得獲取到的關聯事件的準確度較高。
技術領域
本發明涉及事件處理技術領域,特別是一種關聯對象的獲取方法、介質及設備。
背景技術
隨著互聯網的迅速普及和發展,大量數據信息在網絡中產生和傳播,如何從海量自然語言文本中及時準確地找到需要的信息變得日益迫切。海量自然語言文檔具有數據量大,結構不統一,冗余度較高、更新快等特點,通過快速有效的獲取事件的關聯事件,能夠為用戶提供全面的事件信息,并且對海量自然語言文檔進行不斷更新。
目前,現有技術中,獲取關聯事件的方法為:通過事件抽取模型從文本中獲取事件,將抽取到的事件與數據庫中的事件進行類型匹配,類型一致時獲取數據庫中的數據作為事件的關聯事件,以上所述獲取關聯事件的方法存在的問題:
一方面,獲取與事件標簽一致的事件,增加了可匹配對象的數據量;
另一方面,未考慮事件發生的先后順序以及事件之間的關聯關系,使得獲取到的關聯事件的準確度較低。
發明內容
針對上述技術問題,本發明采用的技術方案為:一種關聯對象的獲取方法,包括如下步驟:
S100,獲取初始對象列表和初始事件標簽集,其中,初始事件標簽集包括初始對象列表中每一初始對象對應的初始事件標簽列表。
S200,獲取目標對象和目標對象對應的目標事件標簽E。
S300,根據初始對象列表、初始事件標簽集、目標對象和E,獲取目標對象對應的關鍵對象列表Q',其中,在S300中通過如下步驟獲取Q'。
S301,根據初始對象列表和目標對象,獲取目標對象對應的候選對象列表Q={Q1,Q2,……,Qx,……,Qp},Qx為目標對象對應的第x個候選對象,x=1,2,……,p,p為目標對象對應的候選對象的數量,其中,候選對象為初始對象列表中與目標對象一致的初始對象。
S303,根據初始事件標簽集和Q,獲取Q對應的候選事件標簽集Q0={Q01,Q02,……,Q0x,……,Q0p},Q0x為Qx對應的候選事件標簽列表,其中,候選事件標簽列表為初始事件標簽集中候選對象對應的初始事件標簽列表。
S305,當Q'x∩E=NULL時,將Qx插入至Q'中。
S400,根據E和Q',獲取目標對象對應的關聯對象。
本發明還保護了一種非瞬時性計算機可讀存儲介質,所述存儲介質中存儲有至少一條指令或至少一段程序,所述至少一條指令或所述至少一段程序由處理器加載并執行以實現上述方法。
本發明還保護了一種電子設備,包括處理器和上述的非瞬時性計算機可讀存儲介質。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中科雨辰科技有限公司,未經中科雨辰科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202211534322.5/2.html,轉載請聲明來源鉆瓜專利網。





