[發明專利]一種面向事件序列的因果建模方法及裝置在審
| 申請號: | 202010829960.4 | 申請日: | 2020-08-18 |
| 公開(公告)號: | CN112069227A | 公開(公告)日: | 2020-12-11 |
| 發明(設計)人: | 巫英才;謝瀟;何墨琪 | 申請(專利權)人: | 之江實驗室 |
| 主分類號: | G06F16/2458 | 分類號: | G06F16/2458 |
| 代理公司: | 杭州求是專利事務所有限公司 33200 | 代理人: | 應孔月 |
| 地址: | 310023 浙江省杭州市余*** | 國省代碼: | 浙江;33 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 面向 事件 序列 因果 建模 方法 裝置 | ||
1.一種面向事件序列的因果建模方法,其特征在于,包括:
獲取多條事件序列數據,其中每條事件序列都包含多個帶前后順序關系的事件,事件序列中的事件都來源于一個共享的事件集合;
將事件序列數據轉化為向量化的表示,并完成事件序列的聚類;
使用時間保留的檢測方法獲取聚類結果中每組事件序列所對應的因果網絡,其中因果網絡中每個節點是一個事件,節點之間通過有向邊連接表示因果關系。
2.根據權利要求1所述的一種面向事件序列的因果建模方法,其特征在于,所述事件為空氣污染傳播或體育運動事件。
3.根據權利要求1所述的一種面向事件序列的因果建模方法,其特征在于,所述向量化的方法采用詞袋(Bag-of-Word)模型,統計序列中每個事件的發生次數完成向量化。
4.根據權利要求1所述的一種面向事件序列的因果建模方法,其特征在于,所述聚類的方法采用現有的基于密度的聚類算法。
5.根據權利要求1所述的一種面向事件序列的因果建模方法,其特征在于,使用時間保留的檢測方法獲取聚類結果中每組事件序列所對應的因果網絡,具體包括:
步驟(2.1),一條長度為N的事件序列S包含事件為[e1,…,en],其中ei的發生時間不晚于ei+1,對該事件序列進行展開得到N條子事件序列Si=[e1,…,ei];
步驟(2.2),利用詞袋模型將每條子事件序列Si轉化為一個向量Vi,向量中的每一個維度都代表了一個事件,每一個維度上的值為0或者1,代表事件沒有發生或已經發生;
步驟(2.3),將一類事件序列的子事件序列聚合得到表格T,T中每一行是一個子事件序列,每一列是一個事件;
步驟(2.4),對每個類,將表格T輸入到因果檢測算法中得到反映事件因果關系的因果網絡,由此得到M個組和M個相對應的因果網絡G;
步驟(2.5),判斷整個數據集中每條事件序列與各個因果網絡G的相似度,并將該序列重分配到相似度最高的因果網絡G所對應的組中;
步驟(2.6),迭代執行步驟(2.3)至(2.5),直到每個組所包含的事件序列不再改變,即收斂。
6.根據權利要求5所述的一種面向事件序列的因果建模方法,其特征在于,相似度的計算包括:
統計在事件序列S中觀測到的屬于因果網絡G的因果關系數量;
對于G中的一條因果關系(ei,ej),即ei的發生導致了ej的發生,在事件序列S中觀測到ei先發生而ej后發生的現象則認為該條因果關系得到匹配,否則不匹配,匹配的因果關系的數量越多則認為該因果網絡G與該事件序列S的相似度越高。
7.一種面向事件序列的因果建模裝置,其特征在于,包括:
獲取模塊,用于獲取多條事件序列數據,其中每條事件序列都包含多個帶前后順序關系的事件,事件序列中的事件都來源于一個共享的事件集合;
向量化和聚類模塊,用于將事件序列數據轉化為向量化的表示,并完成事件序列的聚類;
結果獲取模塊,用于使用時間保留的檢測方法獲取聚類結果中每組事件序列所對應的因果網絡,其中因果網絡中每個節點是一個事件,節點之間通過有向邊連接表示因果關系。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于之江實驗室,未經之江實驗室許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010829960.4/1.html,轉載請聲明來源鉆瓜專利網。





