[發(fā)明專利]一種多軌跡數(shù)據(jù)相似度的計算方法和存儲設備在審
| 申請?zhí)枺?/td> | 202011070710.3 | 申請日: | 2020-10-09 |
| 公開(公告)號: | CN112328649A | 公開(公告)日: | 2021-02-05 |
| 發(fā)明(設計)人: | 李年勇;莊莉;蘇江文;王秋琳 | 申請(專利權)人: | 福建億榕信息技術有限公司;國網信息通信產業(yè)集團有限公司;國網信通億力科技有限責任公司 |
| 主分類號: | G06F16/2458 | 分類號: | G06F16/2458;G06F16/25;G06F16/28;G06K9/62 |
| 代理公司: | 福州市景弘專利代理事務所(普通合伙) 35219 | 代理人: | 林祥翔;魏小霞 |
| 地址: | 350000 福建省福*** | 國省代碼: | 福建;35 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 軌跡 數(shù)據(jù) 相似 計算方法 存儲 設備 | ||
本發(fā)明涉及數(shù)據(jù)處理技術領域,特別涉及一種多軌跡數(shù)據(jù)相似度的計算方法和存儲設備。所述一種多軌跡數(shù)據(jù)相似度的計算方法,包括步驟:對來自不同數(shù)據(jù)源的數(shù)據(jù)進行預處理,預處理后的數(shù)據(jù)呈同一數(shù)據(jù)格式;根據(jù)案件信息確定目標軌跡數(shù)據(jù);根據(jù)案件關鍵元素對所述預處理后的數(shù)據(jù)檢索得到嫌疑軌跡數(shù)據(jù)集;對所述嫌疑軌跡數(shù)據(jù)集內的數(shù)據(jù)進行分組,得分組后的嫌疑軌跡數(shù)據(jù);通過在預先搭建好的分析平臺上以最長公共子序列算法并行計算所述目標軌跡數(shù)據(jù)與所述分組后的嫌疑軌跡數(shù)據(jù)的相似度。因為可以并行計算所述目標軌跡數(shù)據(jù)與所述分組后的嫌疑軌跡數(shù)據(jù)的相似度,效率大大提高。
技術領域
本發(fā)明涉及數(shù)據(jù)處理技術領域,特別涉及一種多軌跡數(shù)據(jù)相似度的計算方法和存儲設備。
背景技術
隨著信息化的普及,人們的活動信息被更多的電子設備進行記錄,例如治安卡口數(shù)據(jù)、電子圍欄數(shù)據(jù)、治安監(jiān)控數(shù)據(jù)、交通監(jiān)控數(shù)據(jù)、WI-FI探針數(shù)據(jù)等等。各類基于大范圍監(jiān)測數(shù)據(jù)的智能交通應用快速發(fā)展。多種軌跡碰撞是其中的一類重要應用,它利用目標對象(人員或車輛)的監(jiān)控數(shù)據(jù),挖掘出目標對象軌跡間的相似關系。
傳統(tǒng)的算法對數(shù)據(jù)集合按人物分成多個集合,并依次遍歷多個集合獲取不同的數(shù)據(jù)組合,當數(shù)據(jù)集合越來越多時,時間復雜度會快速增長。通過全量數(shù)據(jù)循環(huán)遍歷比對,來推斷一個案件中多個人是否有接觸或碰面,以及統(tǒng)計接觸或碰面的次數(shù)來推斷案件中多人的關系。在現(xiàn)今可獲取的原始數(shù)據(jù)量大幅增長,犯罪案件涉及人數(shù)越來越多,關系越來越復雜的背景下,傳統(tǒng)分析方法的運算量顯著增長,分析效率低下,無法滿足大數(shù)據(jù)量、多人物應用場景下的數(shù)據(jù)分析要求。
發(fā)明內容
為此,需要提供一種多軌跡數(shù)據(jù)相似度的計算方法,用以解決現(xiàn)有算法在數(shù)據(jù)量大、人物多的情況下效率低下、精準度低的問題。具體技術方案如下:
一種多軌跡數(shù)據(jù)相似度的計算方法,包括步驟:
對來自不同數(shù)據(jù)源的數(shù)據(jù)進行預處理,預處理后的數(shù)據(jù)呈同一數(shù)據(jù)格式;
根據(jù)案件信息確定目標軌跡數(shù)據(jù);
根據(jù)案件關鍵元素對所述預處理后的數(shù)據(jù)檢索得到嫌疑軌跡數(shù)據(jù)集;
對所述嫌疑軌跡數(shù)據(jù)集內的數(shù)據(jù)進行分組,得分組后的嫌疑軌跡數(shù)據(jù);
通過在預先搭建好的分析平臺上以最長公共子序列算法并行計算所述目標軌跡數(shù)據(jù)與所述分組后的嫌疑軌跡數(shù)據(jù)的相似度;
所述案件關鍵元素包括:案件的發(fā)生時間和/或歸屬地。
進一步的,所述“通過在預先搭建好的分析平臺上以最長公共子序列算法并行計算所述目標軌跡數(shù)據(jù)與所述分組后的嫌疑軌跡數(shù)據(jù)的相似度”,還包括步驟:
通過在spark搭建的分析平臺以最長公共子序列算法并行計算所述目標軌跡數(shù)據(jù)與所述分組后的嫌疑軌跡數(shù)據(jù)的相似度。
進一步的,所述呈同一數(shù)據(jù)格式的數(shù)據(jù)內容包括以下中的一種或多種:數(shù)據(jù)時間、設備編碼、設備位置名稱、歸屬地、經度、緯度、用戶唯一標識碼、數(shù)據(jù)類型;
所述用戶唯一標識碼包括:車牌號或IMSI;
所述目標軌跡數(shù)據(jù)為包含經度、緯度的數(shù)組。
進一步的,所述“對所述嫌疑軌跡數(shù)據(jù)集內的數(shù)據(jù)進行分組”,還包括步驟:以所述用戶唯一標識碼和數(shù)據(jù)類型作為分組標識。
進一步的,還包括步驟:
篩選出大于預設相似度閾值的相似度,對篩選出的嫌疑軌跡數(shù)據(jù)進行分析得嫌疑人。
為解決上述技術問題,還提供了一種存儲設備,具體技術方案如下:
一種存儲設備,其中存儲有指令集,所述指令集用于執(zhí)行:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于福建億榕信息技術有限公司;國網信息通信產業(yè)集團有限公司;國網信通億力科技有限責任公司,未經福建億榕信息技術有限公司;國網信息通信產業(yè)集團有限公司;國網信通億力科技有限責任公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011070710.3/2.html,轉載請聲明來源鉆瓜專利網。
- 數(shù)據(jù)顯示系統(tǒng)、數(shù)據(jù)中繼設備、數(shù)據(jù)中繼方法、數(shù)據(jù)系統(tǒng)、接收設備和數(shù)據(jù)讀取方法
- 數(shù)據(jù)記錄方法、數(shù)據(jù)記錄裝置、數(shù)據(jù)記錄媒體、數(shù)據(jù)重播方法和數(shù)據(jù)重播裝置
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)發(fā)送系統(tǒng)、數(shù)據(jù)發(fā)送裝置以及數(shù)據(jù)結構
- 數(shù)據(jù)顯示系統(tǒng)、數(shù)據(jù)中繼設備、數(shù)據(jù)中繼方法及數(shù)據(jù)系統(tǒng)
- 數(shù)據(jù)嵌入裝置、數(shù)據(jù)嵌入方法、數(shù)據(jù)提取裝置及數(shù)據(jù)提取方法
- 數(shù)據(jù)管理裝置、數(shù)據(jù)編輯裝置、數(shù)據(jù)閱覽裝置、數(shù)據(jù)管理方法、數(shù)據(jù)編輯方法以及數(shù)據(jù)閱覽方法
- 數(shù)據(jù)發(fā)送和數(shù)據(jù)接收設備、數(shù)據(jù)發(fā)送和數(shù)據(jù)接收方法
- 數(shù)據(jù)發(fā)送裝置、數(shù)據(jù)接收裝置、數(shù)據(jù)收發(fā)系統(tǒng)、數(shù)據(jù)發(fā)送方法、數(shù)據(jù)接收方法和數(shù)據(jù)收發(fā)方法
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)再現(xiàn)方法、數(shù)據(jù)發(fā)送裝置及數(shù)據(jù)再現(xiàn)裝置
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)再現(xiàn)方法、數(shù)據(jù)發(fā)送裝置及數(shù)據(jù)再現(xiàn)裝置





