[發明專利]一種基于動態知識表示學習的案件推理方法有效
| 申請號: | 201911097694.4 | 申請日: | 2019-11-12 |
| 公開(公告)號: | CN110956254B | 公開(公告)日: | 2022-04-05 |
| 發明(設計)人: | 李永強;陳宇;馮遠靜;陸超倫;阮嘉烽;陳浩;周宇;陳成;任聰 | 申請(專利權)人: | 浙江工業大學 |
| 主分類號: | G06N3/04 | 分類號: | G06N3/04;G06N3/08;G06N5/04;G06Q50/26 |
| 代理公司: | 杭州斯可睿專利事務所有限公司 33241 | 代理人: | 王利強 |
| 地址: | 310014 浙江省*** | 國省代碼: | 浙江;33 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 動態 知識 表示 學習 案件 推理 方法 | ||
1.一種基于動態知識表示學習的案件推理方法,其特征在于,所述方法包括以下步驟:
1)獲取已破獲案件的所有有關數據,包括案發時間、案發地點、作案物品、犯罪人員以及與其有所關聯的所有人員數據,劃分為人員、案件、物品、地點、機構五大類實體,并提取五類實體之間的關系;
2)將所提取出的事件以時間、實體、關系的形式存儲為四元組的格式,符號記為(t,s,r,o),其中t表示事件發生的時間,s表示事件的主實體,r表示關系,o表示事件的客實體;
3)圖數據庫是用于存儲多種關系圖的數據庫,圖中的每個節點代表實體,節點與節點之間的邊代表關系,而時間則作為實體或邊的一種屬性,這樣就可以將定義好的數據以節點-邊-節點的方式存入圖數據庫;
4)知識表示學習的訓練使用的是一種循環神經網絡模型,對四元組數據進行循環事件推理,包括序列編碼器和鄰近聚合模型兩個組成部分,流程如下:
4.1)序列編碼器的目標是表示時序圖譜,假定所有時刻的事件集合定義為E={E1,E2,E3,…Et,…},其中Et為t時刻發生的事件集合,可以得到其事件發生的概率表示:
4.2)根據馬爾可夫假設,該事件在t時刻的狀態只取決于在t時刻之前的τ時段內的狀態,概率表示化簡為:
式中,et為t時刻發生的某具體事件,由四元組定義可知et=(t,s,r,o),根據貝葉斯公式,公式(2)轉化為:
P(et|Et-1,…,Et-τ)=P(ot|st,rt,{Et-1,…,Et-τ})P(st,rt|{Et-1,…,Et-τ}) (3)
4.3)這里假設(st,rt)獨立于過去的事件集合,且建模為均勻分布,則認為P(et|Et-1,…,Et-τ)∝P(ot|st,rt,{Et-1,…,Et-τ}),只考慮s的影響,得到:
式中:Ot為所有(st,rt)對應的客實體ot的集合;
4.4)引入基于RNN的序列編碼器,最終建模為:
P(ot|s,r,{Ot-1(s),…,Ot-τ(s)})=f(s,r,ht-1(s,r)) (5)
ht(s,r)=RNN(s,r,g(Ot(s)),ht-1(s,r)) (6)
式中,ht為第t層RNN循環神經網絡函數層,g(Ot(s))為鄰近聚合模型;
4.5)鄰近聚合模型g(Ot(s))如式(7)所示:
式中:No為集合中o的個數;
4.7)最后使用交叉熵損失函數對嵌入向量進行訓練:
式中,m表示客實體樣本的標簽;ym取0或1,當實體o的標簽為正確樣本時,ym為1,反之則為0;P(o=m|s,r)即o正確的概率;
5)訓練完成后,以案件作為主實體s,案發時間作為t,案件可能的犯罪人員r作為關系,準備進行鏈接預測;
6)預測的方法是將所有實體都作為客實體o代入到四元組(t,s,r,o),這樣對于任意輸入均得到一個預測概率P(o|s,r,t),進行排序,概率越大代表這個人是犯罪人員的可能性越大。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于浙江工業大學,未經浙江工業大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201911097694.4/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種含燕窩的復合發酵提取物及其制備方法和應用
- 下一篇:燃氣熱水設備





