[發明專利]基于k?means算法的公安犯罪類案研判方法在審
| 申請號: | 201710147542.5 | 申請日: | 2017-03-13 |
| 公開(公告)號: | CN107145895A | 公開(公告)日: | 2017-09-08 |
| 發明(設計)人: | 呂品高;王忠林 | 申請(專利權)人: | 東方網力科技股份有限公司 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62;G06Q50/26 |
| 代理公司: | 北京金智普華知識產權代理有限公司11401 | 代理人: | 皋吉甫 |
| 地址: | 100102 北京市朝陽區*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 means 算法 公安 犯罪 研判 方法 | ||
技術領域
本發明涉及一種基于k-means算法的公安犯罪類案研判方法。
背景技術
對于當前社會發生案件,在偵查無法定位犯案人員具體信息情況,通過別的類案聚類為一種相似犯罪類型,通過這些聚類好的類案,結合其他信息(例如:旅業、出行、通聯基站信息)找到共同出現人員,就可以落地為重點嫌疑人,對破案具有重大意義。現在通過一種智能化k-means算法將其相似類案聚類一起,而不需要人工主觀去判斷。
通過調查發現對于類案聚類,一般通過人工通過經驗手動對其相似案例類案聚類,并沒有引進先進智能化、實效性、自動化、高效的聚類研判方法。
對于當前社會發生犯罪案件,一般公安民警到現場偵查提取案件相關信息,但有時候一些案件偵查不到具體任何作案人相關信息,這時候民警人工將一段時間范圍及周邊城市發生類似案例(案件類型、作案時間、作案對象、作案地點、作案人員區域和作案工具)通過人工主觀選取做為類案聚類,然后假想該聚類案件為同一個人或同一伙人犯案,在結合其它相關信息關聯碰撞細化,最終定位到具體犯案人。但是在查找類案定位上通過人工研判會遇到下面幾個問題:1)案件種類繁瑣;2)案件數據量大;3)案件數據容易遺漏;4)人工主觀判斷,增加聚類風險;5)實時性比較低,不能快速類案聚類;6)人工大批量投入,大大增加一線辦案民警的工作量。
發明內容
為了解決上述問題針對這種問題,本發明的目的是提出一種智能化、自動化、準確性的進行類案聚類研判,從而大大降低民警工作量,提高破案效率的基于改進k-means算法的公安犯罪類案研判方法。
本發明的技術方案是:基于改進k-means算法的公安犯罪類案研判方法,其特征在于,該方法為:收集用戶最近已經破案的歷史案件信息存入數據庫中,定義維度向量屬性,抽取數據庫中的案件特征,將抽取出的案件特征利用詞袋模型進行屬性向量化,得到數據庫中案件特征的案件矩陣,運用k-means算法對案件矩陣進行類聚,形成類案庫,取每個類集中的所有案件向量的坐標的平均值,并將K類別的質心組成向量矩陣A;通過用戶輸入新的案件,通過步驟1定義的維度向量屬性確定新輸入案件所對應案件特征向量,并將新的案件標示為向量B1;將B1分別與矩陣A中Ai計算歐幾里得距離,即輸入案件向量與K個類案集的距離,并推送距離最近的類案集給用戶,尋找案件的共性,協助破案。
進一步,該方法具體包括以下步驟:
步驟1:收集用戶已經破案的歷史案件信息存入數據庫中,定義6個維度向量屬性;
步驟2:抽取數據庫中的案件特征,將抽取出的案件特征利用詞袋模型進行屬性向量化,得到數據庫中案件特征的案件矩陣;
步驟3:運用k-means算法對案件矩陣進行聚類,形成類案庫,取每個類集中的所有案件向量的坐標的平均值,視為該類集的質心Ai,i=K最優值,并將K類別的質心組成向量矩陣A;
步驟4:通過用戶輸入新的案件,通過步驟1定義的6個維度向量屬性確定新輸入案件所對應案件特征向量,并將新的案件標示為向量B1;將B1分別與矩陣A中Ai計算歐幾里得距離,即輸入案件向量與K個類案集的距離,并推送距離最近的類案集給用戶,尋找案件的共性,協助破案。
進一步,所述已經破案的歷史案件為至少一個月內的。
進一步,所述步驟1中的維度向量屬性分別為案件類型、作案時間、作案對象、作案地點、作案人員區域和作案工具。
進一步,所述步驟2中:所述詞袋模型進行屬性向量化的具體步驟為:首先計算每一個案情簡要說明Casei中的關鍵詞nameij(nameij表示屬性域值)相對于詞袋中S個基本詞的相似度,S>0,并選出最大相似度;然后將選取的最大相似度乘以關鍵詞nameij在詞袋中的順序使其唯一性,得到nameij對應的數值xij;所有歷史案件的每個特征進行上述操作,得到案件矩陣,為:
式中:x11為第一個案件向量維度-案件類型與詞袋中比對基本相似度最大值,xi1為第i個案件向量維度-案件類型與詞袋中比對基本相似度最大值,X1j為第1個案件向量維度-案件類型與詞袋中比對基本相似度最大值,xi1為第i個案件向量維度-案件類型與詞袋中比對基本相似度最大值,j為維度值,j=6,i為案件數,i>0。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于東方網力科技股份有限公司,未經東方網力科技股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710147542.5/2.html,轉載請聲明來源鉆瓜專利網。





