[發(fā)明專利]一種基于大數(shù)據(jù)挖掘的虛擬身份關(guān)聯(lián)分析方法有效
| 申請(qǐng)?zhí)枺?/td> | 201811490064.9 | 申請(qǐng)日: | 2018-12-06 |
| 公開(公告)號(hào): | CN109614420B | 公開(公告)日: | 2020-08-21 |
| 發(fā)明(設(shè)計(jì))人: | 王國鋒;劉海濱;莊維維;朱榮亞 | 申請(qǐng)(專利權(quán))人: | 南京森根科技股份有限公司 |
| 主分類號(hào): | G06F16/2458 | 分類號(hào): | G06F16/2458;G06F16/215;G06K9/62 |
| 代理公司: | 廣州天河萬研知識(shí)產(chǎn)權(quán)代理事務(wù)所(普通合伙) 44418 | 代理人: | 劉強(qiáng) |
| 地址: | 210000 江蘇省*** | 國省代碼: | 江蘇;32 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 數(shù)據(jù) 挖掘 虛擬 身份 關(guān)聯(lián) 分析 方法 | ||
本發(fā)明提供了一種基于大數(shù)據(jù)挖掘的虛擬身份關(guān)聯(lián)分析算法模型,屬于大數(shù)據(jù)挖掘技術(shù)領(lǐng)域。該方法包括獲取電子串號(hào)信息和物理地址信息;對(duì)源數(shù)據(jù)進(jìn)行清洗處理、規(guī)則過濾;并對(duì)處理后的數(shù)據(jù)進(jìn)行屬性分割、特征提取、指標(biāo)計(jì)算;針對(duì)樣本類別不平衡問題,調(diào)整不同類別訓(xùn)練樣本;搭建Logistic Regression算法模型,以計(jì)算手機(jī)物理地址和電子串號(hào)之間關(guān)系的匹配度,實(shí)現(xiàn)虛擬身份的挖掘分析和關(guān)聯(lián)匹配,本發(fā)明可以通過軌跡追查,確定犯罪軌跡,對(duì)犯罪嫌疑人實(shí)施跟蹤和追捕,偵破案件,最終達(dá)到對(duì)犯罪的有效控制和打擊。
技術(shù)領(lǐng)域
本發(fā)明涉及大數(shù)據(jù)挖掘領(lǐng)域,更具體地說,是一種基于大數(shù)據(jù)挖掘的虛擬身份關(guān)聯(lián)分析方法。
背景技術(shù)
隨著通訊技術(shù)的發(fā)展和電子設(shè)備的普及,手機(jī)已融入人們的日常生活,手機(jī)的運(yùn)動(dòng)軌跡與個(gè)人的活動(dòng)軌跡相伴而生,手機(jī)移動(dòng)軌跡很大程度上可以反映個(gè)人的生活習(xí)慣和活動(dòng)范圍等有價(jià)值的信息。電子串號(hào)數(shù)據(jù)和手機(jī)物理地址數(shù)據(jù)是無線采集終端或移動(dòng)采集設(shè)備捕捉到的并進(jìn)行處理生成的道路數(shù)據(jù)。通過對(duì)電子串號(hào)和物理地址的關(guān)聯(lián)匹配,為某機(jī)關(guān)部門追查罪犯、快速偵破案件提供技術(shù)支持。目前對(duì)電子串號(hào)和物理地址的虛擬身份關(guān)聯(lián)分析的研究少之甚少,且過去在此領(lǐng)域研究的技術(shù)手段和成果還存在很多待優(yōu)化的地方,故如何高效快速地處理獲取后的電子串號(hào)和物理地址的龐大軌跡數(shù)據(jù)成為目前的一大難題。
本發(fā)明對(duì)無線采集終端的數(shù)據(jù),基于大數(shù)據(jù)挖掘分析,找出有價(jià)值的物理地址和電子串號(hào)的軌跡信息,根據(jù)算法構(gòu)建出物理地址和電子串號(hào)的關(guān)聯(lián)匹配模型,實(shí)現(xiàn)虛擬身份的確定和匹配,為某機(jī)關(guān)部門跟蹤抓捕犯罪嫌疑人、打擊罪犯提供重要技術(shù)支持。
發(fā)明內(nèi)容
針對(duì)上述背景技術(shù)中所提出的問題,本發(fā)明實(shí)施例的目的在于提供一種基于大數(shù)據(jù)挖掘的虛擬身份關(guān)聯(lián)分析方法,通過將采集到的數(shù)據(jù)進(jìn)行清洗、篩選,特征構(gòu)建及提取等處理,建立算法模型,提供了具有關(guān)聯(lián)匹配關(guān)系的電子串號(hào)和物理地址的虛擬身份信息,為數(shù)據(jù)關(guān)聯(lián)匹配提供技術(shù)支持。
為了實(shí)現(xiàn)上述目的,本發(fā)明的技術(shù)方案如下:
一種基于大數(shù)據(jù)挖掘的虛擬身份關(guān)聯(lián)分析方法,包括以下步驟:
S1:電子串號(hào)及物理地址數(shù)據(jù)預(yù)處理;分別對(duì)無線數(shù)據(jù)采集終端的電子串號(hào)和物理地址的臟數(shù)據(jù)進(jìn)行處理,如數(shù)據(jù)去重、缺失值和異常值刪除等;
S2:關(guān)聯(lián)數(shù)據(jù)篩選及存儲(chǔ);將滿足篩選規(guī)則的數(shù)據(jù)存儲(chǔ)于數(shù)據(jù)庫中;
S3:樣本特征構(gòu)建及提取;對(duì)關(guān)聯(lián)數(shù)據(jù)進(jìn)行屬性分割及結(jié)合,構(gòu)建M個(gè)樣本特征,并對(duì)特征數(shù)據(jù)進(jìn)行降維處理,使樣本變量維度變?yōu)镹;
S4:類別不平衡問題處理;采用Fisher判別法調(diào)整不同類別訓(xùn)練樣本;
S5:建立及優(yōu)化電子串號(hào)與物理地址關(guān)聯(lián)模型;根據(jù)算法建立模型,得出電子串號(hào)與物理地址的匹配度。
優(yōu)選的,所述步驟S2中篩選規(guī)則具體步驟為:
S201、將時(shí)間差范圍內(nèi)(即|t1-t2|Δt,其中t1和t2分別表示電子串號(hào)和物理地址被采集到的時(shí)間)采集到的電子串號(hào)和物理地址數(shù)據(jù)中的無線數(shù)據(jù)采集終端經(jīng)緯度字段進(jìn)行匹配,若經(jīng)緯度一致,則將此組電子串號(hào)和物理地址作為匹配對(duì),并轉(zhuǎn)入步驟S202;若不一致,則舍棄;
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于南京森根科技股份有限公司,未經(jīng)南京森根科技股份有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811490064.9/2.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 數(shù)據(jù)顯示系統(tǒng)、數(shù)據(jù)中繼設(shè)備、數(shù)據(jù)中繼方法、數(shù)據(jù)系統(tǒng)、接收設(shè)備和數(shù)據(jù)讀取方法
- 數(shù)據(jù)記錄方法、數(shù)據(jù)記錄裝置、數(shù)據(jù)記錄媒體、數(shù)據(jù)重播方法和數(shù)據(jù)重播裝置
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)發(fā)送系統(tǒng)、數(shù)據(jù)發(fā)送裝置以及數(shù)據(jù)結(jié)構(gòu)
- 數(shù)據(jù)顯示系統(tǒng)、數(shù)據(jù)中繼設(shè)備、數(shù)據(jù)中繼方法及數(shù)據(jù)系統(tǒng)
- 數(shù)據(jù)嵌入裝置、數(shù)據(jù)嵌入方法、數(shù)據(jù)提取裝置及數(shù)據(jù)提取方法
- 數(shù)據(jù)管理裝置、數(shù)據(jù)編輯裝置、數(shù)據(jù)閱覽裝置、數(shù)據(jù)管理方法、數(shù)據(jù)編輯方法以及數(shù)據(jù)閱覽方法
- 數(shù)據(jù)發(fā)送和數(shù)據(jù)接收設(shè)備、數(shù)據(jù)發(fā)送和數(shù)據(jù)接收方法
- 數(shù)據(jù)發(fā)送裝置、數(shù)據(jù)接收裝置、數(shù)據(jù)收發(fā)系統(tǒng)、數(shù)據(jù)發(fā)送方法、數(shù)據(jù)接收方法和數(shù)據(jù)收發(fā)方法
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)再現(xiàn)方法、數(shù)據(jù)發(fā)送裝置及數(shù)據(jù)再現(xiàn)裝置
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)再現(xiàn)方法、數(shù)據(jù)發(fā)送裝置及數(shù)據(jù)再現(xiàn)裝置
- 確定吸收制品功效
- 一種虛擬機(jī)的安全訪問方法及虛擬機(jī)系統(tǒng)
- 一種虛擬桌面的解鎖方法及裝置
- 一種實(shí)時(shí)處理虛擬交換機(jī)網(wǎng)絡(luò)流量的虛擬化平臺(tái)
- 虛擬智能家居實(shí)訓(xùn)系統(tǒng)及其虛擬實(shí)訓(xùn)方法
- 虛擬機(jī)的磁盤資源的管理方法和裝置
- 一種基于KVM的虛擬網(wǎng)卡管理方法
- 虛擬資源數(shù)據(jù)處理方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)
- 基于虛擬環(huán)境的道具使用方法、裝置、設(shè)備及介質(zhì)
- 虛擬道具的獲取方法、裝置、設(shè)備及介質(zhì)





