[發(fā)明專利]基于時間序列聚類的未成年犯罪地區(qū)簇的劃分方法在審
| 申請?zhí)枺?/td> | 201811156907.1 | 申請日: | 2018-09-30 |
| 公開(公告)號: | CN109241320A | 公開(公告)日: | 2019-01-18 |
| 發(fā)明(設(shè)計)人: | 潘仲贏;陳恒至;郭濟;王俊;郭磊;王春華 | 申請(專利權(quán))人: | 電子科技大學(xué) |
| 主分類號: | G06F16/53 | 分類號: | G06F16/53;G06K9/62 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 611731 四川省成*** | 國省代碼: | 四川;51 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 犯罪 時間序列 聚類 時間序列曲線 聚類算法 時間序列分析 數(shù)據(jù)歸一化 犯罪特征 平滑處理 時間滯后 數(shù)據(jù)清洗 相似特征 種類變化 傳統(tǒng)的 清洗 繪制 輸出 統(tǒng)計 分析 研究 | ||
基于時間序列聚類的未成年犯罪地區(qū)簇的劃分方法。傳統(tǒng)的未成年犯罪特征分析通常采用簡單的統(tǒng)計方法,結(jié)合犯罪邏輯學(xué),對我國未成年犯罪數(shù)量呈現(xiàn)趨勢、種類變化、地區(qū)分布等做一個簡單的總結(jié)。傳統(tǒng)方法存在時間滯后性,同時無法應(yīng)對日益增長的數(shù)據(jù)。本發(fā)明是一種結(jié)合時間序列分析與聚類算法對各地區(qū)未成年人犯罪數(shù)據(jù)進行簇劃分的方法,將具有相似特征的地區(qū)劃分到一簇。具體步驟如下:步驟一,收集各地區(qū)未成年犯罪數(shù)據(jù),進行數(shù)據(jù)清洗,提取所需數(shù)據(jù);步驟二,對清洗后的數(shù)據(jù)歸一化,并繪制時間序列曲線,對時間序列曲線進行平滑處理;步驟三,基于本發(fā)明聚類算法對時間序列進行聚類;步驟四,輸出劃分的簇。本發(fā)明可以準(zhǔn)確將各地區(qū)進行簇劃分,對進一步研究未成年犯罪具有重要的意義。
技術(shù)領(lǐng)域
本發(fā)明涉及公共安全技術(shù)領(lǐng)域,尤其涉及一種基于時間序列聚類的未成年犯罪地區(qū)簇的劃分方法。
背景技術(shù)
隨著大數(shù)據(jù)時代到來和人工智能技術(shù)的發(fā)展,利用大數(shù)據(jù)為基礎(chǔ)進行相關(guān)分析的技術(shù)已經(jīng)成為未成年犯罪分析技術(shù)研究的熱點。而為了有效地對全國各地區(qū)未成年犯罪特征進行分析,在獲取全國各地區(qū)未成年犯罪數(shù)據(jù)后,有關(guān)警務(wù)部門必須進行快速、準(zhǔn)確地分組,判斷哪些地區(qū)具有相似犯罪特征,采取針對性地干預(yù)措施。因此,針對未成年犯罪,將全國各地區(qū)進行分組是未成年犯罪研究中的基礎(chǔ)工作,對警力分配、犯罪預(yù)防、犯罪干預(yù)等有重要意義。
聚類(Clustering)是對數(shù)據(jù)進行分類,將相異的數(shù)據(jù)盡可能地分開,而將相似的數(shù)據(jù)聚成一個類別(簇),使得同一類別的數(shù)據(jù)具有盡可能高的同質(zhì)性(homogeneity),類別之間有盡可能高的異質(zhì)性(heterogeneity),從而方便從數(shù)據(jù)中發(fā)現(xiàn)隱含的有用信息。聚類主要分為:劃分聚類、層次聚類、模糊聚類和基于密度聚類,經(jīng)典算法有:K-means算法、K-中心點算法、EM算法等。聚類典型的應(yīng)用包含幾方面:(1)協(xié)同過濾:用于推薦系統(tǒng)和用戶細(xì)分;(2)動態(tài)趨勢檢測:對流數(shù)據(jù)進行聚類,檢測動態(tài)趨勢和模式;(3)用于多媒體數(shù)據(jù)、生物數(shù)據(jù)、社交網(wǎng)絡(luò)數(shù)據(jù)的應(yīng)用。聚類已廣泛應(yīng)用在不同領(lǐng)域,并取得了良好的應(yīng)用效果,但在未成年犯罪領(lǐng)域應(yīng)用較為欠缺。
時間序列(Time Series)是一組按照時間發(fā)生先后順序進行排列的數(shù)據(jù)點序列。通常一組時間序列的時間間隔為一恒定值(如1秒,5分鐘,12小時,7天,1年),因此時間序列可以作為離散時間數(shù)據(jù)進行分析處理。時間序列廣泛應(yīng)用于數(shù)理統(tǒng)計、信號處理、模式識別、計量經(jīng)濟學(xué)、數(shù)學(xué)金融、天氣預(yù)報、地震預(yù)測、腦電圖、控制工程、航空學(xué)、通信工程以及絕大多數(shù)涉及到時間數(shù)據(jù)測量的應(yīng)用科學(xué)與工程學(xué)。
目前我國未成年犯罪預(yù)測分析技術(shù)多采用簡單的統(tǒng)計方法,如通過對兩個特定年份未成年犯罪抽樣調(diào)查資料的比較研究,結(jié)合犯罪邏輯學(xué),對我國未成年犯罪數(shù)量呈現(xiàn)趨勢、種類變化、地區(qū)分布等做一個簡單的總結(jié)。隨著犯罪數(shù)據(jù)的不斷增多,數(shù)據(jù)復(fù)雜程度的增加,傳統(tǒng)的統(tǒng)計方法具有很大局限性。
本專利采用時間序列分析平滑原始犯罪數(shù)據(jù)中受噪聲干擾的點,還原地區(qū)實際的未成年犯罪規(guī)律,同時,建立地區(qū)犯罪可能性模型,從而方便選取K個質(zhì)心,針對于K均值聚類中所需的距離,利用動態(tài)時間規(guī)整算法(Dynamic Time Warping)來確定。動態(tài)時間規(guī)整算法最早出現(xiàn)于語音識別中,解決了發(fā)音長短不一的問題。本發(fā)明將其應(yīng)用在時間序列中,可以解決時間序列長短不一致的問題。由于全國各地區(qū)差異,未成年犯罪的統(tǒng)計存在時間跨度不一致的情況,利用傳統(tǒng)的歐式距離效果較差,而DTW算法可以解決這一問題。
本專利方法可以很好地排除噪聲對于地區(qū)犯罪規(guī)律的影響,并且可以解決時間序列長度不一致問題,同時依據(jù)建立的地區(qū)犯罪可能性模型可以方便選取K均值聚類所需質(zhì)心,取得良好的未成年犯罪地區(qū)分組效果。
發(fā)明內(nèi)容
本發(fā)明要解決的問題在于:全國各地區(qū)未成年犯罪數(shù)據(jù)統(tǒng)計具有時間跨度不一致、部分點受噪聲影響明顯特點,同時單純時間序列分析無法對地區(qū)進行分組。
為了解決上述問題,本發(fā)明提供如下方案:
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于電子科技大學(xué),未經(jīng)電子科技大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811156907.1/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





