[發明專利]圍繞特定目標的情報信息獲取方法在審
| 申請號: | 202010721842.1 | 申請日: | 2020-07-24 |
| 公開(公告)號: | CN111967250A | 公開(公告)日: | 2020-11-20 |
| 發明(設計)人: | 孟濤;李佳靜;于瓏雪 | 申請(專利權)人: | 南京網感至察信息科技有限公司 |
| 主分類號: | G06F40/279 | 分類號: | G06F40/279;G06F16/9535;G06F16/9538 |
| 代理公司: | 南京經緯專利商標代理有限公司 32200 | 代理人: | 湯金燕 |
| 地址: | 210000 江蘇省南京市秦淮區永智路6號南*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 圍繞 特定 目標 情報 信息 獲取 方法 | ||
1.一種圍繞特定目標的情報信息獲取方法,其特征在于,包括如下步驟:
S12,設定所關注的目標實體,以及所述目標實體的種子關系,并設定所述目標實體關聯的目標網絡資源;
S13,將所述目標實體加入到目標集合中,將所述目標實體的種子關系加入關系集合中;
S14,采用設定搜索策略對目標集合中的目標實體沿著種子關系進行擴展,得到擴展關系集合;
S15,識別所述擴展關系集合中的關系主體,在所述目標網絡資源中獲取各個關系主體的相關網頁集合;
S16,從所述相關網頁集合中抽取實體和實體關系,根據抽取得到的實體和實體關系分別對所述目標集合及所述關系集合進行擴展,以更新所述目標集合及所述關系集合;
S17,針對更新后的目標集合及關系集合,循環執行步驟S14至步驟S16,直至更新后的目標集合及關系集合均達到設定分析要求;
S18,根據更新后的目標集合及關系集合抓取所述目標集合的各個情報信息,根據各個情報信息構建情報集合。
2.根據權利要求1所述的圍繞特定目標的情報信息獲取方法,其特征在于,還包括:
根據更新后的目標集合及關系集合抽取所述目標實體的關系網絡。
3.根據權利要求1所述的圍繞特定目標的情報信息獲取方法,其特征在于,所述設定搜索策略包括深度優先策略,廣度優先策略,或者可信度優先策略。
4.根據權利要求1所述的圍繞特定目標的情報信息獲取方法,其特征在于,根據各個情報信息構建情報集合包括:
按照各個情報信息所關聯網頁的時鮮度、與所述目標實體的相關性或者路徑長度進行排序,根據排序結果構建所述目標實體的情報集合。
5.根據權利要求1所述的圍繞特定目標的情報信息獲取方法,其特征在于,所述目標實體包括具有可描述意義的單詞或短語,在特定領域內具有特定含義的內容,和/或,特定領域的專有詞匯;
所述目標實體之間具有屬性關系、因果關系、時序關系、反轉關系、條件關系和/或上下級事件關系。
6.根據權利要求1所述的圍繞特定目標的情報信息獲取方法,其特征在于,所述種子關系包括由相應領域情報專家給出的與目標實體關聯的實體關系,以用于對相應算法進行初始化。
7.根據權利要求1所述的圍繞特定目標的情報信息獲取方法,其特征在于,在步驟S12之前,還包括:
S11,進行情報語料收集,以構建語料庫;
所述從所述相關網頁集合中抽取實體和實體關系包括:
基于所述語料庫,采用設定規則模板和機器學習的方法抽取相關網頁集合中的實體和實體關系。
8.根據權利要求7所述的圍繞特定目標的情報信息獲取方法,其特征在于,所述根據抽取得到的實體和實體關系分別對所述目標集合及所述關系集合進行擴展包括:
根據所抽取實體所關聯網頁的時鮮度或者與目標實體的關系強度,對抽取得到的實體和實體關系進行排序選擇,根據排序選擇的結果對所述目標集合及所述關系集合進行擴展。
9.根據權利要求1所述的圍繞特定目標的情報信息獲取方法,其特征在于,所述設定分析要求包括情報數量、搜索深度或者分析粒度。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于南京網感至察信息科技有限公司,未經南京網感至察信息科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010721842.1/1.html,轉載請聲明來源鉆瓜專利網。





