[發(fā)明專利]一種基于移動(dòng)大數(shù)據(jù)的預(yù)出境用戶識(shí)別方法有效
| 申請(qǐng)?zhí)枺?/td> | 202010017938.X | 申請(qǐng)日: | 2020-01-08 |
| 公開(公告)號(hào): | CN111274338B | 公開(公告)日: | 2022-11-08 |
| 發(fā)明(設(shè)計(jì))人: | 許國(guó)良;張軒;徐千淞;李萬林;王超;雒江濤;易燕 | 申請(qǐng)(專利權(quán))人: | 重慶郵電大學(xué) |
| 主分類號(hào): | G06F16/29 | 分類號(hào): | G06F16/29;G06F16/9535;G06F17/18;G06Q10/06;G06Q30/02;H04W4/02;G06K9/62 |
| 代理公司: | 北京同恒源知識(shí)產(chǎn)權(quán)代理有限公司 11275 | 代理人: | 趙榮之 |
| 地址: | 400065 *** | 國(guó)省代碼: | 重慶;50 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 移動(dòng) 數(shù)據(jù) 出境 用戶 識(shí)別 方法 | ||
1.一種基于移動(dòng)大數(shù)據(jù)的預(yù)出境用戶識(shí)別方法,其特征在于,該方法具體包括以下步驟:
S1:采集出境服務(wù)機(jī)構(gòu)的通信基站位置數(shù)據(jù)、出境服務(wù)通話端口數(shù)據(jù)和出境服務(wù)APP的域名關(guān)鍵詞數(shù)據(jù),利用所采集數(shù)據(jù)建立維表數(shù)據(jù)庫(kù);
S2:基于維表數(shù)據(jù)庫(kù)與移動(dòng)大數(shù)據(jù),分別提取用戶的通話行為特征、上網(wǎng)行為特征、出行行為特征和靜態(tài)特征;
S3:將用戶的行為特征和靜態(tài)特征進(jìn)行聚合關(guān)聯(lián),構(gòu)建特征寬表,具體步驟包括:將上網(wǎng)特征用戶集合U1、出行軌跡特征用戶集合U2、國(guó)內(nèi)通話特征用戶集U3、國(guó)際通話特征用戶集合U4和靜態(tài)特征用戶集合U5中的用戶ID進(jìn)行聚合和剔重,得到全部用戶集合U6;將全部用戶集合U6通過布爾運(yùn)算式分別和特征用戶集合U1、U2、U3、U4和U5進(jìn)行關(guān)聯(lián)匹配,使得同一用戶的所有特征匯聚到一起,得到特征聚合后的用戶集合U7;
S4:設(shè)計(jì)特征選擇算法,從特征寬表中篩選與類別強(qiáng)相關(guān)的特征子集,具體步驟包括:確定用于訓(xùn)練的特征數(shù)目M1,依據(jù)特征和類別的相關(guān)性,設(shè)定特征評(píng)價(jià)函數(shù)J(x);利用隨機(jī)森林進(jìn)行特征重要性排序,篩選出Top M1特征集合Fa;利用GBDT進(jìn)行特征重要性排序,篩選出Top M1特征集合Fb;利用LightGBM進(jìn)行特征重要性排序,篩選出Top M1特征集合Fc;將集合Fa、Fb、Fc中的特征進(jìn)行融合剔重,得到特征集合Fd;采用序列后向選擇算法,每次從特征集合Fd中剔除特征x,使得評(píng)價(jià)函數(shù)J(x)最優(yōu);直到特征集合的數(shù)量達(dá)到設(shè)定的特征數(shù)目M1為止;
S5:借助邏輯回歸分類器構(gòu)建預(yù)出境用戶識(shí)別模型,完成模型的訓(xùn)練、評(píng)估與調(diào)參;
S6:將待測(cè)試數(shù)據(jù)輸入識(shí)別模型,識(shí)別預(yù)出境用戶。
2.根據(jù)權(quán)利要求1所述的一種基于移動(dòng)大數(shù)據(jù)的預(yù)出境用戶識(shí)別方法,其特征在于,步驟S1中,所述維表數(shù)據(jù)庫(kù)包括基站維表、APP維表和通話維表,具體構(gòu)建方法為:
1)采集出境服務(wù)機(jī)構(gòu)歸屬通信基站信息,依據(jù)出境服務(wù)機(jī)構(gòu)與歸屬通信基站的一對(duì)多映射關(guān)系,構(gòu)建基站維表;
2)采集出境服務(wù)APP的詳細(xì)網(wǎng)絡(luò)封包信息,擷取APP的域名和關(guān)鍵詞,依據(jù)APP與域名、關(guān)鍵詞的一對(duì)多映射關(guān)系,構(gòu)建APP維表;
3)采集出境服務(wù)機(jī)構(gòu)的服務(wù)通話端口信息,驗(yàn)證通話端口有效性,依據(jù)出境服務(wù)機(jī)構(gòu)與通話端口的一對(duì)多映射關(guān)系,構(gòu)建通話維表。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于重慶郵電大學(xué),未經(jīng)重慶郵電大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010017938.X/1.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 移動(dòng)臺(tái),基站,移動(dòng)通信系統(tǒng),移動(dòng)通信與移動(dòng)通信程序
- 移動(dòng)通信系統(tǒng)、移動(dòng)終端以及移動(dòng)通信方法
- 移動(dòng)支付裝置、移動(dòng)終端POS以及移動(dòng)終端
- 移動(dòng)控制裝置、移動(dòng)體、移動(dòng)體系統(tǒng)、移動(dòng)控制方法及程序
- 移動(dòng)終端后蓋、移動(dòng)終端殼體及移動(dòng)終端
- 移動(dòng)平臺(tái)的輔助移動(dòng)方法、移動(dòng)裝置及移動(dòng)平臺(tái)
- 自移動(dòng)設(shè)備移動(dòng)方法及自移動(dòng)設(shè)備
- 移動(dòng)輪(支撐移動(dòng))
- 移動(dòng)房屋(移動(dòng)酒店)
- 移動(dòng)控制方法、移動(dòng)裝置及移動(dòng)平臺(tái)
- 數(shù)據(jù)顯示系統(tǒng)、數(shù)據(jù)中繼設(shè)備、數(shù)據(jù)中繼方法、數(shù)據(jù)系統(tǒng)、接收設(shè)備和數(shù)據(jù)讀取方法
- 數(shù)據(jù)記錄方法、數(shù)據(jù)記錄裝置、數(shù)據(jù)記錄媒體、數(shù)據(jù)重播方法和數(shù)據(jù)重播裝置
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)發(fā)送系統(tǒng)、數(shù)據(jù)發(fā)送裝置以及數(shù)據(jù)結(jié)構(gòu)
- 數(shù)據(jù)顯示系統(tǒng)、數(shù)據(jù)中繼設(shè)備、數(shù)據(jù)中繼方法及數(shù)據(jù)系統(tǒng)
- 數(shù)據(jù)嵌入裝置、數(shù)據(jù)嵌入方法、數(shù)據(jù)提取裝置及數(shù)據(jù)提取方法
- 數(shù)據(jù)管理裝置、數(shù)據(jù)編輯裝置、數(shù)據(jù)閱覽裝置、數(shù)據(jù)管理方法、數(shù)據(jù)編輯方法以及數(shù)據(jù)閱覽方法
- 數(shù)據(jù)發(fā)送和數(shù)據(jù)接收設(shè)備、數(shù)據(jù)發(fā)送和數(shù)據(jù)接收方法
- 數(shù)據(jù)發(fā)送裝置、數(shù)據(jù)接收裝置、數(shù)據(jù)收發(fā)系統(tǒng)、數(shù)據(jù)發(fā)送方法、數(shù)據(jù)接收方法和數(shù)據(jù)收發(fā)方法
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)再現(xiàn)方法、數(shù)據(jù)發(fā)送裝置及數(shù)據(jù)再現(xiàn)裝置
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)再現(xiàn)方法、數(shù)據(jù)發(fā)送裝置及數(shù)據(jù)再現(xiàn)裝置





