[發明專利]一種大數據環境下一人多卡識別方法有效
| 申請號: | 202011142356.0 | 申請日: | 2020-10-23 |
| 公開(公告)號: | CN111970685B | 公開(公告)日: | 2021-01-15 |
| 發明(設計)人: | 張穎;顧高翔;劉杰 | 申請(專利權)人: | 上海世脈信息科技有限公司 |
| 主分類號: | H04W8/18 | 分類號: | H04W8/18;H04W8/24;G06F16/909 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 201210 上海*** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 數據 環境 下一人多卡 識別 方法 | ||
1.一種大數據環境下一人多卡識別方法,其特征在于,包括以下步驟:
步驟1、從傳感器運營商獲取EPID編號唯一的匿名加密移動終端傳感器數據,提取指定時間段內所觸發的通信信令記錄,對其記錄的樣點按等時間間隔進行擴充,獲得其出行時空軌跡;
步驟2、從出行時空軌跡中截取大量等時間間隔的個體軌跡片段,構建比較向量一致性指標,計算固定時間段內固定時間間隔下隨機選取的出行軌跡的一致性指標,獲得判定兩條軌跡是否一致的一致性檢驗指標;
步驟3、從數據庫選定一個移動通信卡號作為待匹配對象,獲取其出行時空序列,遍歷移動通信記錄數據庫,從中選取其他個體出行時空序列與其進行匹配,在時空序列中隨機截取相同點位的序列片段,計算兩條時空序列的空間位置上的相關性,對其進行一致性檢驗,判斷其是否為同一人持有;
步驟4、遍歷整個數據庫后獲取所有已判定與初始選定移動通信卡號為同一人持有的其他卡號,將其標注為同一人持有,為其標識個體編號PID,針對數據庫中的每一組個體出行時空序列,均以遍歷數據庫的方式將其與所有其他個體的出行時空序列進行匹配,判別其是否為同一人持有,若出現一個卡號為多個人同時持有的情況,即某一卡號與兩個相互不匹配的卡號的相似性均能通過檢驗,則將其歸于相似度更大的移動通信卡;
步驟5、在遍歷完數據庫,為所有移動通信卡號均進行了出行時空序列匹配后,判斷其是否與其他卡號存在為一人持有的情況,針對每一組一人多卡記錄,查詢其多個卡號與固定傳感器的通信記錄,將卡號改為個體標識PID,依據時間順序將多條出行時空序列相互內插為一條移動通信記錄集,將新的記錄集作為手持移動通信卡與固定傳感器的通信記錄存入數據庫并進行等時間間距的時空加權插值,獲取更加精細的個體出行時空序列。
2.如權利要求1所述的一種大數據環境下一人多卡識別方法,其特征在于,所述步驟1根據移動通信卡的唯一編號EPID,查詢其在指定時間段內所有的通訊記錄,初步構建由個體通過單一移動通信卡號和固定傳感器通信記錄構成的個體出行時空軌跡,采用時空加權插值法,對每條個體出行時空軌跡進行等時間間距的空間插值,獲得等時間間隔的個體出行時空序列,刪除原始的移動通信卡與固定傳感器之間的通信記錄,完全以插值得到的個體出行時空序列代表個體在時空上的移動,構建個體在指定時間段T內等時間間隔Th的出行時空序列,序列中包含T/Th+1個節點,每個節點均包含了時間和XY坐標信息。
3.如權利要求1所述的一種大數據環境下一人多卡識別方法,其特征在于,所述步驟2基于個體出行時空序列,構建時空序列一致性比對指標矩陣M,M為2×n×m×3階矩陣,2表示其區分同網異網兩種情況;n為按一天24小時劃分出來的時間段數量;m表示每個時間段內采樣節點數量情況;3表示每個時間段內每種采樣節點數量的三個一致性判別標準,分別代表95%、99%和99.9%置信,遍歷M矩陣,單次提取其兩兩出行時空序列片段之間基于皮爾遜積矩值及相似性所構建的一致性指標;統計N對時空序列樣本得到的 的平均值,并設置, , 共3個級別的一致性指標從不同層次對時空序列的相似性進行約束,即其一致性在95%,99%和99.9%水平上顯著,令其分別為 、、。
4.如權利要求1所述的一種大數據環境下一人多卡識別方法,其特征在于,所述步驟3對目標卡號獲取隨機時間段內的出行時空序列,將其與數據庫中每個卡號的同時間段序列進行對比:若一致性指標大于,舍棄該出行時空序列;若一致性指標小于等于,則不斷隨機截取兩條出行時間序列上相同點位的片段,計算其一致性指標,直至該出行時空序列被舍棄或判定兩條出行時空序列代表同一人出行的軌跡。
5.如權利要求4所述的一種大數據環境下一人多卡識別方法,其特征在于,所述步驟3針對 、 和這三個置信區間,設定這兩組出行時空序列C1和Ci為同一人出行軌跡的抽樣數判別閾值及一致性對比結果在這三個置信區間內的抽樣數量,當一致性指標大于該時間段的一致性比對指標,舍棄該出行時空序列,否則在任意置信區間內滿足一致性指標的抽樣數大于等于抽樣數判別閾值,則判定判斷為同一人所有的兩條出行時空序列。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于上海世脈信息科技有限公司,未經上海世脈信息科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011142356.0/1.html,轉載請聲明來源鉆瓜專利網。
- 數據顯示系統、數據中繼設備、數據中繼方法、數據系統、接收設備和數據讀取方法
- 數據記錄方法、數據記錄裝置、數據記錄媒體、數據重播方法和數據重播裝置
- 數據發送方法、數據發送系統、數據發送裝置以及數據結構
- 數據顯示系統、數據中繼設備、數據中繼方法及數據系統
- 數據嵌入裝置、數據嵌入方法、數據提取裝置及數據提取方法
- 數據管理裝置、數據編輯裝置、數據閱覽裝置、數據管理方法、數據編輯方法以及數據閱覽方法
- 數據發送和數據接收設備、數據發送和數據接收方法
- 數據發送裝置、數據接收裝置、數據收發系統、數據發送方法、數據接收方法和數據收發方法
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置





