[發明專利]一種用于開源事件關聯預測的遞增張量分解方法及系統有效
| 申請號: | 202010220384.3 | 申請日: | 2020-03-25 |
| 公開(公告)號: | CN111461193B | 公開(公告)日: | 2023-04-18 |
| 發明(設計)人: | 符永銓;沈思淇;王慶林;黃春;蘇華友;李榮春;姜晶菲;李東升;竇勇 | 申請(專利權)人: | 中國人民解放軍國防科技大學 |
| 主分類號: | G06F18/2135 | 分類號: | G06F18/2135;G06F18/24 |
| 代理公司: | 長沙國科天河知識產權代理有限公司 43225 | 代理人: | 董惠文 |
| 地址: | 410073 湖*** | 國省代碼: | 湖南;43 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 用于 事件 關聯 預測 遞增 張量 分解 方法 系統 | ||
本發明公開一種用于開源事件關聯預測的遞增張量分解方法及系統,該方法包括:以事件數據導入的多維特征為核心要素類別建立事件全局索引結構,根據新到達事件數據遞增維護事件全局索引結構,完成事件索引遞增數據結構的構建;采用隱含因子矩陣表示結構構建事件張量分解模型并初始化,根據隨機梯度下降方法建立張量遞增更新規則,通過動態事件數據更新張量分解模型;根據隱含因子矩陣預測任意兩事件要素的關聯關系、任意兩事件的關聯關系,抽取事件記錄主成分。用于解決現有技術中事件數據高階稀疏、事件主成分探索及事件數據持續更新問題,實現適應高階稀疏、支持主成分探索、支持數據持續更新。
技術領域
本發明涉及數據處理技術領域,具體是一種用于全球開源事件關聯預測和主成分抽取的遞增張量分解方法及系統。
背景技術
隨著大數據技術的不斷發展,國際關系事件數據不斷豐富和完善,其中以GDELT為代表的開源事件數據提供涉及全球不同地理區域、不同時間段的海量事件信息尤為知名。近幾年來GDELT的月數據子集即可達到千萬級事件規模;GDELT年數據規模千萬甚至億量級。挖掘和利用GDELT事件數據之間的內在結構和關聯關系成為對復雜國際國內形勢精準研判的重要途徑。
GDELT事件數據在空間和時間維度具有高度復雜的耦合結構。事件關聯分析采取神經網絡技術構建事件的向量表示,然后通過向量表示的相似度預測對應事件間的關聯程度。現有事件挖掘方法面臨三個方面的問題:
(1)事件數據高階稀疏問題:事件數據的維度多,同一事件的數據樣本少,導致很多實體間的活動不可直接觀測到,迫切需要構建統一的表示模型;
(2)事件主成分探索問題:探索相同主題下不同實體、不同行動的影響力,不同時間段的活躍性,迫切需要根據主題分解事件的主要要素將多維數據進行主題分解;
(3)事件數據持續更新問題:事件數據每天更新,事件之間的關聯關系發生動態變化,迫切需要支持數據持續更新的分析手段。
發明內容
本發明提供一種用于開源事件關聯預測的遞增張量分解方法及系統,用于克服現有技術中由于事件數據高階稀缺導致很多實體間活動不能直接觀測等缺陷,實現適應高階稀疏、支持主成分探索、支持數據持續更新。
為實現上述目的,本發明提供一種用于開源事件關聯預測的遞增張量分解方法,包括:
步驟1,以事件數據導入的多維特征為核心要素類別建立事件全局索引結構,根據新到達事件數據遞增維護所述事件全局索引結構,完成事件索引遞增數據結構的構建;
步驟2,采用隱含因子矩陣表示結構構建事件的張量分解模型,初始化張量分解模型參數,根據隨機梯度下降方法建立張量遞增更新規則,通過動態事件數據更新張量分解模型;
步驟3,根據隱含因子矩陣表示預測任意兩個事件要素(包括事件的實體、事件的類型、事件的時間區間)之間的關聯關系、任意兩個事件的關聯關系,抽取事件記錄的主成分。
為實現上述目的,本發明還提供一種用于開源事件關聯預測的遞增張量分解系統,包括處理器及與所述處理器連接的存儲器,所述存儲器存儲有用于開源事件關聯預測的遞增張量分解程序,所述處理器運行所述用于開源事件關聯預測與主成分抽取的遞增張量分解程序執行上述方法的步驟。
本發明提供的用于全球開源事件數據關聯預測與主成分抽取的遞增張量分解方法及系統,生成全局事件張量索引適應事件遞增處理,采取隱含因子矩陣表示結構支持高階稀疏的張量記錄,采取隨機梯度下降方法支持張量模型遞增訓練,支持事件主成分和事件關聯關系的在線查詢。與現有的基于神經網絡的張量分析方法相比,能夠填補適應高階稀疏、支持主成分探索、支持數據持續更新的不足。
附圖說明
圖1為本發明實施例一提供用于全球開源事件數據關聯預測與主成分抽取的遞增張量分解方法的流程圖;
具體實施方式
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國人民解放軍國防科技大學,未經中國人民解放軍國防科技大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010220384.3/2.html,轉載請聲明來源鉆瓜專利網。





