[發明專利]案件檢測方法、裝置、電子設備及可讀存儲介質在審
| 申請號: | 202010034236.2 | 申請日: | 2020-01-13 |
| 公開(公告)號: | CN111259951A | 公開(公告)日: | 2020-06-09 |
| 發明(設計)人: | 楊鵬飛;李亮;李堯 | 申請(專利權)人: | 北京明略軟件系統有限公司 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62;G06N3/04;G06N3/08;G06Q50/18 |
| 代理公司: | 北京超成律師事務所 11646 | 代理人: | 劉靜 |
| 地址: | 100000 北京市海*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 案件 檢測 方法 裝置 電子設備 可讀 存儲 介質 | ||
1.一種案件檢測方法,其特征在于,所述方法包括:
獲取當前案件的第一案件信息;
將所述第一案件信息輸入經過訓練的第一機器學習模型、第二機器學習模型,得到由所述第一機器學習模型對所述當前案件進行分類的分類結果,以及得到由所述第二機器學習模型從所述第一案件信息提取的案件特征;
基于所述分類結果及所述案件特征,生成所述當前案件的特征碼,所述特征碼包括分別與所述分類結果及所述案件特征對應的碼段,用于檢測所述當前案件與歷史案件的相似度。
2.根據權利要求1所述的方法,其特征在于,所述方法還包括:
基于所述特征碼及每個歷史案件的特征碼,確定所述當前案件與每個歷史案件的相似度;
從所述歷史案件中選取指定數量的相似度最大的案件為所述當前案件的相似案件。
3.根據權利要求2所述的方法,其特征在于,所述方法還包括:
基于所述當前案件、所述相似案件、獲取的與所述相似案件對應的相似案件,生成案件關系圖。
4.根據權利要求2所述的方法,其特征在于,所述基于所述特征碼及每個歷史案件的特征碼,確定所述當前案件與每個歷史案件的相似度,包括:
基于所述當前案件的所述特征碼與每個歷史案件的特征碼的漢明距離,確定所述當前案件與每個歷史案件的相似度,其中,所述特征碼中同一位置的碼段的特征屬性及字節長度相同。
5.根據權利要求1所述的方法,其特征在于,在所述將所述第一案件信息輸入經過訓練的第一機器學習模型、第二機器學習模型之前,所述方法還包括:
獲取用于訓練的案件信息集合,所述案件信息集合包括多個案件對應的第二案件信息,每個所述第二案件信息包括案件的分類標注;
通過所述案件信息集合訓練第一機器學習模型,得到經過訓練的所述第一機器學習模型,以對所述第一案件信息分類;
通過所述案件信息集合訓練第二機器學習模型,得到經過訓練的所述第二機器學習模型,以從所述第一案件信息提取案件特征,其中,訓練所述第二機器學習模型的每個所述第二案件信息包括案件特征標注。
6.根據權利要求1-5中任意一項所述的方法,其特征在于,所述第一機器學習模型包括BERT模型,所述第二機器學習模型包括BERT模型、BiLSTM模型及CRF模型。
7.根據權利要求1-5中任意一項所述的方法,其特征在于,所述案件特征包括作案手段、作案時間、侵害對象中的至少一種。
8.一種案件檢測裝置,其特征在于,所述裝置包括:
獲取單元,用于獲取當前案件的第一案件信息;
輸入單元,用于將所述第一案件信息輸入經過訓練的第一機器學習模型、第二機器學習模型,得到由所述第一機器學習模型對所述當前案件進行分類的分類結果,以及得到由所述第二機器學習模型從所述第一案件信息提取的案件特征;
特征檢測單元,用于基于所述分類結果及所述案件特征,生成所述當前案件的特征碼,所述特征碼包括分別與所述分類結果及所述案件特征對應的碼段,用于檢測所述當前案件與歷史案件的相似度。
9.一種電子設備,其特征在于,所述電子設備包括相互耦合的存儲器、處理器,所述存儲器內存儲計算機程序,當所述計算機程序被所述處理器執行時,使得所述電子設備執行如權利要求1-7中任一項所述的方法。
10.一種計算機可讀存儲介質,其特征在于,所述可讀存儲介質中存儲有計算機程序,當所述計算機程序在計算機上運行時,使得所述計算機執行如權利要求1-7中任意一項所述的方法。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京明略軟件系統有限公司,未經北京明略軟件系統有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010034236.2/1.html,轉載請聲明來源鉆瓜專利網。





