[發明專利]一種大數據環境下一人多卡識別方法有效
| 申請號: | 202011142356.0 | 申請日: | 2020-10-23 |
| 公開(公告)號: | CN111970685B | 公開(公告)日: | 2021-01-15 |
| 發明(設計)人: | 張穎;顧高翔;劉杰 | 申請(專利權)人: | 上海世脈信息科技有限公司 |
| 主分類號: | H04W8/18 | 分類號: | H04W8/18;H04W8/24;G06F16/909 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 201210 上海*** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 數據 環境 下一人多卡 識別 方法 | ||
本發明提供了一種大數據環境下一人多卡識別方法。本發明充分利用現有的海量手持移動通信設備與固定傳感器間的通信記錄,設計比對算法和一致性檢驗標準,不僅能低成本、自動化、便捷地對目標數據進行整理,識別出其中隸屬一人的多個卡號,有效地從大量通信記錄中提取出空間中的實際個體,降低一人多卡對總體統計的影響,還能通過多個卡號的時空軌跡融合,更加精確地獲取個體的出行時空序列,從而為其他空間大數據分析提供更加可靠的數據基礎。
技術領域
本發明涉及一種基于海量移動通信數據的一人持有多卡狀態的識別方法,屬于大數據分析技術領域。
背景技術
近年來,隨著信息技術的發展,數據信息量呈現爆炸式增長,數據來源越來越多,數據量也越來越龐大。其中,由手機、WIFI、物聯網等信息傳感器記錄的數據已經成為大數據分析中最重要的數據來源,其較為完備的個體出行記錄為大數據,尤其是交通大數據分析提供了很好的數據支持。
采用傳感器通信數據進行城市社會經濟方面的研究和分析,固然可以更加精準地將研究細化到城市中活動的個體,但是其樣本分布仍然與現實分布存在較大的偏差,使得其本身的有偏性對分析結果帶來嚴重影響。其中,一人多卡現象的存在就對采用移動通信大數據的研究工作帶來了極大的困擾。一人多卡指的是同一人在同一或不同移動通信運營商下辦理了多個卡號。當前,高中低端手機搭配使用和雙卡雙待手機的熱銷表明一人持有雙卡,乃至多卡現象的普遍性,若不對這一現象進行處理,則在分析城市人群時空移動過程中會產生大量冗余時空軌跡,造成分析結果的偏差。2019年10月,國內三家運營商移動、聯通、電信,活躍用戶數量分別為9.4359億、3.22119億、3.3253億,共計15.982億手機用戶,2018年末全國人口數量不過13.9538億,人均手機卡號數量達到1.145,同網多卡和異網多卡已經達到相當高的程度。但是,對一人多卡現象的識別存在難度,因為每個卡號都會獨立地與基站、WIFI等固定傳感器進行通信,這使得即便是同一個移動通信網絡,兩張卡與固定傳感器的通信記錄組成的時空軌跡之間也會存在差異,而異網卡號之間更是存在固定傳感器自身位置差異,使得一人多卡現象更難被識別,也缺乏判定的標準。因此,我們需要在數據預處理階段采用一定的算法,計算出一套判斷一人多卡現象的指標體系,識別出同一人持有的多個移動通信卡號的方法,對原始數據進行精簡和合并,同時基于合并后的個體數據,采用多重數據加權插值方式進一步提升個體的出行時空軌跡的精確度,以此為基礎,更新并維護PID(Personal IDentify,個體標識,PID)與運營商卡號的相互映射表,以便后續用于具體統計分析時進行縮樣處理,即只統計PID數量,降低一人多卡對總體統計的影響。
發明內容
本發明的目的是利用移動通信設備與固定傳感器之間的通信記錄組成的個體出行時空軌跡所表征個體在空間上的移動情況,提供對同時期不同卡號的出行時空軌跡進行采樣和比較,判斷其相似性,并以此為基礎構建一人多卡判別的一致性指標,對通過不同移動通信卡記錄下的出行軌跡是否屬于同一人進行識別和判斷,對于存在多卡使用的個體,利用多卡的通信記錄完善個體出行時空軌跡,并從多個卡號中選擇記錄最完善的一個,以此為基礎,更新并維護個體標識PID與運營商卡號的相互映射表,以便后續用于具體統計分析時縮樣處理,即只統計PID數量,降低一人多卡對總體統計的影響。
為了達到上述目的,本發明的技術方案是提供了一種大數據環境下構建一人多卡識別算法及其一致性校驗指標,包括以下步驟:
步驟1、從傳感器運營商獲取匿名加密移動終端傳感器數據,匿名加密移動終端傳感器數據在時間與空間上連續,不同移動終端單向不可逆加密卡號對應不同編號,提取每個卡號在指定時間段內所觸發的通信信令記錄,構成個體通過該卡號記錄下的出行時空通信記錄數據集合,對其按時間排列,將其空間位置投射到地圖上,在數據配準的基礎上,通過時空插值法對其記錄的樣點按等時間間隔進行擴充,獲得以每張移動通信卡號為識別標志的出行時空軌跡;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于上海世脈信息科技有限公司,未經上海世脈信息科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011142356.0/2.html,轉載請聲明來源鉆瓜專利網。
- 數據顯示系統、數據中繼設備、數據中繼方法、數據系統、接收設備和數據讀取方法
- 數據記錄方法、數據記錄裝置、數據記錄媒體、數據重播方法和數據重播裝置
- 數據發送方法、數據發送系統、數據發送裝置以及數據結構
- 數據顯示系統、數據中繼設備、數據中繼方法及數據系統
- 數據嵌入裝置、數據嵌入方法、數據提取裝置及數據提取方法
- 數據管理裝置、數據編輯裝置、數據閱覽裝置、數據管理方法、數據編輯方法以及數據閱覽方法
- 數據發送和數據接收設備、數據發送和數據接收方法
- 數據發送裝置、數據接收裝置、數據收發系統、數據發送方法、數據接收方法和數據收發方法
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置





