[發明專利]基于k?means算法的公安犯罪類案研判方法在審
| 申請號: | 201710147542.5 | 申請日: | 2017-03-13 |
| 公開(公告)號: | CN107145895A | 公開(公告)日: | 2017-09-08 |
| 發明(設計)人: | 呂品高;王忠林 | 申請(專利權)人: | 東方網力科技股份有限公司 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62;G06Q50/26 |
| 代理公司: | 北京金智普華知識產權代理有限公司11401 | 代理人: | 皋吉甫 |
| 地址: | 100102 北京市朝陽區*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 means 算法 公安 犯罪 研判 方法 | ||
1.基于改進k-means算法的公安犯罪類案研判方法,其特征在于,該方法為:收集用戶最近已經破案的歷史案件信息存入數據庫中,定義維度向量屬性,抽取數據庫中的案件特征,將抽取出的案件特征利用詞袋模型進行屬性向量化,得到數據庫中案件特征的案件矩陣,運用k-means算法對案件矩陣進行聚類,形成類案庫,取每個類集中的所有案件向量的坐標的平均值,并將K類別的質心組成向量矩陣A;通過用戶輸入新的案件,根據定義的維度向量屬性確定新輸入案件所對應案件特征向量,并將新的案件標示為向量B1;將B1分別與矩陣A中Ai計算歐幾里得距離,即輸入案件向量與K個類案集的距離,并推送距離最近的類案集給用戶,尋找案件的共性,協助破案。
2.根據權利要求1所述的公安犯罪類案研判方法,其特征在于,該方法具體包括以下步驟:
步驟1:收集用戶已經破案的歷史案件信息存入數據庫中,定義6個維度向量屬性;
步驟2:抽取數據庫中的案件特征,將抽取出的案件特征利用詞袋模型進行屬性向量化,得到數據庫中案件特征的案件矩陣;
步驟3:運用k-means算法對案件矩陣進行聚類,形成類案庫,取每個類集中的所有案件向量的坐標的平均值,視為該類集的質心Ai,i=K最優值,并將K類別的質心組成向量矩陣A;
步驟4:通過用戶輸入新的案件,通過步驟1定義的6個維度向量屬性確定新輸入案件所對應案件特征向量,并將新的案件標示為向量B1;將B1分別與矩陣A中Ai計算歐幾里得距離,即輸入案件向量與K個類案集的距離,并推送距離最近的類案集給辦案民警用戶,尋找案件的共性,協助破案。
3.根據權利要求2所述的公安犯罪類案研判方法,其特征在于,所述已經破案的歷史案件為至少一個月內的。
4.根據權利要求2所述的公安犯罪類案研判方法,其特征在于,所述步驟1中的維度向量屬性分別為案件類型、作案時間、作案對象、作案地點、作案人員區域和作案工具。
5.根據權利要求2所述的公安犯罪類案研判方法,其特征在于,所述步驟2中:所述詞袋模型進行屬性向量化的具體步驟為:首先計算每一個案情簡要說明Casei中的關鍵詞nameij相對于詞袋中S個基本詞的相似度,S>0,并選出最大相似度;然后將選取的最大相似度乘以關鍵詞nameij在詞袋中的順序使其唯一性,得到nameij對應的數值xij;所有歷史案件的每個特征進行上述操作,得到案件矩陣,為:
式中:x11為第一個案件向量維度-案件類型與詞袋中比對基本相似度最大值,xi1為第i個案件向量維度-案件類型與詞袋中比對基本相似度最大值,X1j為第1個案件向量維度-案件類型與詞袋中比對基本相似度最大值,xij為第i個案件向量維度-案件類型與詞袋中比對基本相似度最大值,j為維度值,j=6,j為案件數,j>0。
6.根據權利要求2所述的公安犯罪類案研判方法,其特征在于,所述步驟3中:K值的確定為:
首先,根據案件類型確定的K值的取值范圍,K的取值范圍為1-100;
其次,將確定的K值的范圍結合輪廓系數的循環算法求出每個K值的對應值分別為輪廓系數值,如果其中一個輪廓系數值最接近1,則該輪廓系數值為輪廓系數最優值,該輪廓系數最優值對應K值為K最優值,將該K最優值作為輸入參量。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于東方網力科技股份有限公司,未經東方網力科技股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710147542.5/1.html,轉載請聲明來源鉆瓜專利網。





