[發明專利]一種基于時空數據融合的犯罪數量預測方法在審
| 申請號: | 202010742859.5 | 申請日: | 2020-07-29 |
| 公開(公告)號: | CN111861028A | 公開(公告)日: | 2020-10-30 |
| 發明(設計)人: | 方路平;葉瑞輝;董齊芬 | 申請(專利權)人: | 浙江工業大學 |
| 主分類號: | G06Q10/04 | 分類號: | G06Q10/04;G06N3/04;G06F16/9537;G06F16/2458;G06F16/22 |
| 代理公司: | 杭州斯可睿專利事務所有限公司 33241 | 代理人: | 王利強 |
| 地址: | 310014 浙江省*** | 國省代碼: | 浙江;33 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 時空 數據 融合 犯罪 數量 預測 方法 | ||
1.一種基于時空數據融合的犯罪數量預測方法,其特征在于,該方法包括以下步驟:
(1)區域劃分:將研究的地區進行地理空間分割,形成多個區域,將所有區域按照位置關系嵌入一個表格中;
(2)犯罪數據預處理:統計所述各個區域中的犯罪數量,并進行歸一化處理,構建有監督的訓練集和測試集;
(3)POI數據預處理:統計所述各個區域的各類POI數量,并進行歸一化處理,然后嵌入所述步驟(1)中的表格中并轉化為POI張量;
(4)時空特征提取:利用LSTM模型提取所述步驟(2)中犯罪數據集的時間特征Ylstm,利用二維卷積從所述步驟(3)的POI張量中提取空間特征Yconv;
(5)時空特征融合與輸出:將所述步驟(4)中提取出來的時間特征Ylstm和空間特征Yconv轉化為一維向量再作拼接,然后通過一個全連接層得到輸出,即下一時期的各個區域的犯罪數量估計。
2.如權利要求1所述的一種基于時空數據融合的犯罪數量預測方法,其特征在于,所述步驟(1)中,區域劃分過程如下:
如果預測地區已實行網格化管理,則按照當地的巡邏或管理轄區作為區域劃分依據,然后根據各個區域上下左右的相鄰關系將區域近似填入一個有I×J個方格的表格中,一個區域對應一個方格;
如果預測地區沒有實行網格化管理,則根據地區邊界的經緯度來進行簡單的網格劃分,將所研究地區劃分為I×J的網格;
上述I×J的網格中區域的個數用M表示,剩下的(I×J—M)個網格稱為“空白網格”。
3.如權利要求1或2所述的一種基于時空數據融合的犯罪數量預測方法,其特征在于,所述步驟(2)中,犯罪數據預處理過程如下:
(2a)獲取地區的犯罪記錄,每條記錄包含犯罪的時間和地點的坐標信息,對所有數據進行清洗、去除異常值后映射到所述步驟(1)中生成的表格中,然后將每個所述區域內的犯罪記錄數據劃分為相同時間間隔的犯罪數據時間序列;
(2b)對所述犯罪數據時間序列按區域進行歸一化處理,并劃分為有監督的測試集和訓練集,所述歸一化處理的公式如下:
式中和分別表示所述區域i在時段t的犯罪數量和其歸一化后的值,Ei,min和Ei,max分別表示所述區域i中犯罪數量的最小值和最大值。
4.如權利要求1或2所述的一種基于時空數據融合的犯罪數量預測方法,其特征在于,所述步驟(3)中,POI數據預處理過程如下:
(3a)從地圖軟件獲取所預測地區的各類POI的數據信息,包含名稱、類別和坐標信息;
(3b)將各類POI數據映射到所述步驟(1)中生成的表格中,并統計各個區域各類POI的數量,其中表格中“空白網格”的POI數量記為0;
(3c)將POI數量按類型進行歸一化處理,所述歸一化處理的公式如下:
式中和分別表示區域m中類型j的POI數量和其歸一化后的值,Zj,min和Zj,max分別表示j類型中POI數量的最小值和最大值;
(3d)每一類POI數據映射后的表格都轉化為矩陣保存,有P類POI數據則保存為P個矩陣,并合并為張量。
5.如權利要求1或2所述的一種基于時空數據融合的犯罪數量預測方法,其特征在于,所述步驟(4)中,時空特征提取包含以下步驟:
(4a)時間特征提取:利用LSTM模型來進行時間特征的提取,設所述區域m在過去時間段t和n個時間段的犯罪數量為將所有區域的犯罪數據{X1,X2,…,XM}作為所述LSTM模型的輸入,其中每個LSTM單元的維度為M,則所述LSTM模型的輸出表示為:
Ylstm=F(X1,X2,…,XM)
式中用F表示LSTM的計算過程;
對于LSTM模型中的計算,t時間段各個區域的犯罪數量用向量xt表示,即那么模型中t時間段具體的記憶單元計算如下:
ft=δ(wf·[ht-1,xt]+bf)
it=δ(wi·[ht-1,xt]+bi)
C’t=tanh(wc·[ht-1,xt]+bc)
Ot=δ(wo·[ht-1xt]+bo)
其中,表示矩陣的點乘,wf、wi、wc、wo分別表示遺忘門、輸入門、狀態單元、輸出們的權重矩陣,bf、bi、bc、bo分別表示遺忘門、輸入門、狀態單元、輸出們的偏置,ft、it、Ct、Ot、ht分別表示遺忘門的輸出、輸入門的輸出、狀態單元的輸出、輸出門的輸出部分以及記憶單元的最終輸出,Ct-1、ht-1分別表示前一時期的狀態門的輸出和記憶單元輸出,C’t表示候選狀態,δ表示sigmoid激活函數;
(4b)空間特征提取:將所述步驟(3)中形成的各類POI矩陣合并轉化為張量RP×I×J,其中P為選取的POI類別數,I和J為表格的長和寬,將此張量作為二維卷積的輸入,其計算過程表示如下:
Yconv=f(Wk*RP×I×J+bk)
其中Yconv表示POI張量經過二維卷積后的輸出張量,*表示二維卷積運算,f表示激活函數relu:max{x,0},Wk表示權重矩陣,bk為偏置項。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于浙江工業大學,未經浙江工業大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010742859.5/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種液壓閥生產線用的去毛刺設備
- 下一篇:一種碼垛機械手
- 同類專利
- 專利分類
G06Q 專門適用于行政、商業、金融、管理、監督或預測目的的數據處理系統或方法;其他類目不包含的專門適用于行政、商業、金融、管理、監督或預測目的的處理系統或方法
G06Q10-00 行政;管理
G06Q10-02 .預定,例如用于門票、服務或事件的
G06Q10-04 .預測或優化,例如線性規劃、“旅行商問題”或“下料問題”
G06Q10-06 .資源、工作流、人員或項目管理,例如組織、規劃、調度或分配時間、人員或機器資源;企業規劃;組織模型
G06Q10-08 .物流,例如倉儲、裝貨、配送或運輸;存貨或庫存管理,例如訂貨、采購或平衡訂單
G06Q10-10 .辦公自動化,例如電子郵件或群件的計算機輔助管理
- 數據顯示系統、數據中繼設備、數據中繼方法、數據系統、接收設備和數據讀取方法
- 數據記錄方法、數據記錄裝置、數據記錄媒體、數據重播方法和數據重播裝置
- 數據發送方法、數據發送系統、數據發送裝置以及數據結構
- 數據顯示系統、數據中繼設備、數據中繼方法及數據系統
- 數據嵌入裝置、數據嵌入方法、數據提取裝置及數據提取方法
- 數據管理裝置、數據編輯裝置、數據閱覽裝置、數據管理方法、數據編輯方法以及數據閱覽方法
- 數據發送和數據接收設備、數據發送和數據接收方法
- 數據發送裝置、數據接收裝置、數據收發系統、數據發送方法、數據接收方法和數據收發方法
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置





