[發明專利]一種用于開源事件關聯預測的遞增張量分解方法及系統有效
| 申請號: | 202010220384.3 | 申請日: | 2020-03-25 |
| 公開(公告)號: | CN111461193B | 公開(公告)日: | 2023-04-18 |
| 發明(設計)人: | 符永銓;沈思淇;王慶林;黃春;蘇華友;李榮春;姜晶菲;李東升;竇勇 | 申請(專利權)人: | 中國人民解放軍國防科技大學 |
| 主分類號: | G06F18/2135 | 分類號: | G06F18/2135;G06F18/24 |
| 代理公司: | 長沙國科天河知識產權代理有限公司 43225 | 代理人: | 董惠文 |
| 地址: | 410073 湖*** | 國省代碼: | 湖南;43 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 用于 事件 關聯 預測 遞增 張量 分解 方法 系統 | ||
1.一種用于開源事件關聯預測的遞增張量分解方法,其特征在于,包括:
步驟1,以事件數據導入的多維特征為核心要素類別建立事件全局索引結構,根據新到達事件數據遞增維護所述事件全局索引結構,完成事件索引遞增數據結構的構建;
步驟2,采用隱含因子矩陣表示結構構建事件的張量分解模型,初始化張量分解模型參數,根據隨機梯度下降方法建立張量遞增更新規則,通過動態事件數據更新張量分解模型;
步驟3,根據隱含因子矩陣表示張量分解模型預測任意兩個事件要素之間的關聯關系、任意兩個事件的關聯關系,抽取事件記錄的主成分;
所述步驟2具體包括:
步驟21,構建事件高階張量的表示模型,包括:
步驟211,構建記錄事件報道次數的高階張量E,張量E由包含事件主動方、事件被動方、事件類型、時間區間四類要素,張量E中的任意元素表示為E(i,j,k,l)=v,含義為事件主動方索引為i,事件被動方索引為j,事件類型索引為k,事件時間區間索引為l,事件報道次數為v;
步驟212,構建高階張量E的表示模型基于PARAFAC張量分解模型利用隱含因子矩陣A建模事件主動方,隱含因子矩陣B建模事件被動方,隱含因子矩陣C建模事件類型,隱含因子矩陣D建模事件時間區間,通過隱含因子矩陣的外積編碼事件報道次數張量E的表示模型
其中A∈RN×r,B∈RN×r,C∈RJ×r,D∈RK×r,正整數N代表事件實體總數,正整數r代表張量分解的秩,正整數J代表事件類型總數,正整數K代表事件時間區間總數,R代表實數,A(i,h)代表隱含因子矩陣A中第i行第h列的元素,B(j,h)代表隱含因子矩陣B中第j行第h列的元素,C(k,h)代表隱含因子矩陣C中第k行第h列的元素,D(l,h)代表隱含因子矩陣D中第l行第h列的元素;i∈[1,N]、j∈[1,N]、h∈[1,r]、k∈[1,J]、l∈[1,K];
步驟22,構建事件高階張量模型的訓練目標函數并初始化高階張量E的表示模型,包括:
針對張量E中的一個位置為(i,j,k,l),定義損失函數為:
針對張量E中觀測到的數據項集合Ω,定義模型訓練目標函數L為一個帶有正則化項的最小平方和函數:
其中α代表正則化參數,默認值為0.1,代表矩陣A的2-范數,定義為Ai代表矩陣A的第i個行向量,ΩA代表觀測項中事件主動方實體集合;代表矩陣B的2-范數,定義為ΩB代表觀測項中事件被動方集合;代表矩陣C的2-范數,定義為ΩC代表觀測項中事件類型集合;代表矩陣D的2-范數,定義為ΩD代表觀測項中事件類型集合,利用范圍為-1到1區間的非零均勻隨機數初始化隱含因子矩陣A、B、C、D。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國人民解放軍國防科技大學,未經中國人民解放軍國防科技大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010220384.3/1.html,轉載請聲明來源鉆瓜專利網。





