[發明專利]基于知識圖譜的風險預測方法、裝置、設備及存儲介質在審
申請號: | 202011279427.1 | 申請日: | 2020-11-16 |
公開(公告)號: | CN112365171A | 公開(公告)日: | 2021-02-12 |
發明(設計)人: | 杜翠鳳;智海峰;唐榮;周洪林 | 申請(專利權)人: | 廣州杰賽科技股份有限公司;廣州杰賽通信規劃設計院有限公司 |
主分類號: | G06Q10/06 | 分類號: | G06Q10/06;G06Q10/04;G06F16/36;G06K9/62;G06N3/04;G06N3/08;G06Q50/26 |
代理公司: | 廣州三環專利商標代理有限公司 44202 | 代理人: | 麥小嬋;郝傳鑫 |
地址: | 510310 廣東*** | 國省代碼: | 廣東;44 |
權利要求書: | 查看更多 | 說明書: | 查看更多 |
摘要: | |||
搜索關鍵詞: | 基于 知識 圖譜 風險 預測 方法 裝置 設備 存儲 介質 | ||
本發明公開了一種基于知識圖譜的風險預測方法、裝置、設備及存儲介質,該方法,包括:對數據源的犯罪數據進行關系抽取,獲得RDF數據;RDF數據包括若干個實體三元組;根據RDF數據,構建犯罪知識圖譜;利用預先構建的圖深度學習模型對犯罪知識圖譜進行時間相關性分析,獲得融合時間相關性特征的犯罪知識圖譜;根據融合時間相關性特征的犯罪知識圖譜,對預先構建的卷積神經網絡進行訓練,獲得犯罪風險預測模型;根據當前采集的犯罪風險數據,通過犯罪風險預測模型,獲得犯罪風險預測結果;通過實體三元組構建犯罪知識圖譜,有效挖掘司法案件的實體關系,基于犯罪知識圖譜和圖深度學習進行風險預測,能有效提高犯罪風險預測的效率和準確性。
技術領域
本發明涉及人工智能的自然語言處理技術領域,尤其涉及一種基于知識圖譜的風險預測方法、裝置、設備及存儲介質。
背景技術
隨著我國不斷深入推進“智慧司法”建設,中國裁判文書網、中國庭審公開網等平臺的相繼建成運行,司法公開達到前所未有的廣度和深度。而詞法領域是一個龐大的知識體系,且領域知識比較復雜,隨著司法公開數據的不斷增大,數據之間的關系也越來越復雜,目前只能處理簡單數據關系的傳統關系型數據庫已無法勝任,且面向司法案件的風險預測研究比較還是比較匱乏,例如,目前一般只能通過專家知識與人工手段對犯罪風險進行預測分析,風險預效率、準確較低。
發明內容
針對上述問題,本發明的目的在于提供一種基于知識圖譜的風險預測方法、裝置、設備及存儲介質,其能有效挖掘司法案件的實體關系,提高犯罪風險預測的效率和準確性。
第一方面,本發明實施例提供了一種基于知識圖譜的風險預測方法,包括:
對數據源的犯罪數據進行關系抽取,獲得RDF數據;所述RDF數據包括若干個實體三元組;
根據所述RDF數據,構建犯罪知識圖譜;
利用預先構建的圖深度學習模型對所述犯罪知識圖譜進行時間相關性分析,獲得融合時間相關性特征的犯罪知識圖譜;
根據融合時間相關性特征的犯罪知識圖譜,對預先構建的卷積神經網絡進行訓練,獲得犯罪風險預測模型;
根據當前采集的犯罪風險數據,通過所述犯罪風險預測模型,獲得犯罪風險預測結果。
作為上述方案的改進,所述對數據源的犯罪數據進行關系抽取,獲得RDF數據,包括:
將所述犯罪數據輸入到預先構建的基于BERT-BiLSTM-CRF算法的關系抽取模型進行關系抽取,得到所述RDF數據。
作為上述方案的改進,所述實體三元組包括實體、所述實體的屬性及屬性值。
作為上述方案的改進,所述方法還包括關系抽取模型構建步驟,具體包括:
將所述數據源的犯罪數據劃分為訓練樣本和測試樣本;
將所述訓練樣本輸入BERT模型,獲得所述訓練樣本的詞向量;
將所述詞向量輸入到BiLSTM-CRF模型進行訓練,獲得關系抽取模型;
利用所述測試樣本對所述關系抽取模型進行測試,獲得最終的初始關系抽取模型。
作為上述方案的改進,所述方法還包括:
利用K-Means算法對所述犯罪知識圖譜的實體進行聚類,得到若干個實體群;
確定待處理的實體所屬的實體群,作為候選實體群;
從所述候選實體群中獲取與所述待處理的實體距離最近的實體,作為候選實體;
從所述數據源中獲取所述候選實體對應的決策數據,作為所述待處理的實體的決策數據。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于廣州杰賽科技股份有限公司;廣州杰賽通信規劃設計院有限公司,未經廣州杰賽科技股份有限公司;廣州杰賽通信規劃設計院有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011279427.1/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種通用型防腐漿料
- 下一篇:一種基于大數據調整NLP模型容量的方法
- 同類專利
- 專利分類
G06Q 專門適用于行政、商業、金融、管理、監督或預測目的的數據處理系統或方法;其他類目不包含的專門適用于行政、商業、金融、管理、監督或預測目的的處理系統或方法
G06Q10-00 行政;管理
G06Q10-02 .預定,例如用于門票、服務或事件的
G06Q10-04 .預測或優化,例如線性規劃、“旅行商問題”或“下料問題”
G06Q10-06 .資源、工作流、人員或項目管理,例如組織、規劃、調度或分配時間、人員或機器資源;企業規劃;組織模型
G06Q10-08 .物流,例如倉儲、裝貨、配送或運輸;存貨或庫存管理,例如訂貨、采購或平衡訂單
G06Q10-10 .辦公自動化,例如電子郵件或群件的計算機輔助管理