[發(fā)明專利]一種基于Fisher分和近似馬爾科夫毯的移動用戶出境特征選擇方法有效
| 申請?zhí)枺?/td> | 202010130947.X | 申請日: | 2020-02-28 |
| 公開(公告)號: | CN111339165B | 公開(公告)日: | 2022-06-03 |
| 發(fā)明(設(shè)計)人: | 許國良;張軒;王超;李萬林;雒江濤;易燕 | 申請(專利權(quán))人: | 重慶郵電大學(xué) |
| 主分類號: | G06F16/2458 | 分類號: | G06F16/2458;G06K9/62 |
| 代理公司: | 北京同恒源知識產(chǎn)權(quán)代理有限公司 11275 | 代理人: | 趙榮之 |
| 地址: | 400065 *** | 國省代碼: | 重慶;50 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 fisher 近似 馬爾科夫毯 移動用戶 出境 特征 選擇 方法 | ||
1.一種基于Fisher分和近似馬爾科夫毯的移動用戶出境特征選擇方法,其特征在于,該方法包括以下步驟:
S1:獲取移動用戶樣本的上網(wǎng)、通話、軌跡和屬性數(shù)據(jù),對用戶樣本進(jìn)行打標(biāo),構(gòu)建訓(xùn)練集和測試集;
S2:利用提供出境服務(wù)的APP、電話、機(jī)構(gòu)位置基站信息提取用戶樣本的出境特征,對特征集歸一化處理;
S3:根據(jù)Fisher分剔除出境特征集中不相關(guān)的特征,獲得Fisher候選特征集;
S4:設(shè)計融合最大的互信息值和對稱不確定性的相關(guān)性度量標(biāo)準(zhǔn)MSCC,剔除Fisher候選特征集中不相關(guān)的特征,獲得MSCC候選特征集;
S5:利用近似Markov-Blanket剔除MSCC候選特征集中的冗余特征,獲得最優(yōu)出境特征子集;
S6:利用集成學(xué)習(xí)思想構(gòu)建分類模型,完成待測樣本的分類;
分類模型的構(gòu)建方法包括:
S61:分類模型設(shè)計為兩層結(jié)構(gòu),第一層分別采用KNN、LightGBM、邏輯回歸、AdaBoost算法構(gòu)建基分類器,第二層采用隨機(jī)森林算法構(gòu)建次級分類器;
S62:采用交叉驗(yàn)證的方式,四個基分類器分別對最優(yōu)特征集合進(jìn)行學(xué)習(xí)和預(yù)測,最終得到基分類器對訓(xùn)練集的預(yù)測結(jié)果T1,對測試集的預(yù)測結(jié)果T2;
S63:將T1作為訓(xùn)練集,T2作為測試集,然后輸入次級分類器中進(jìn)行學(xué)習(xí)和預(yù)測,得到最終的預(yù)測結(jié)果。
2.根據(jù)權(quán)利要求1所述的一種基于Fisher分和近似馬爾科夫毯的移動用戶出境特征選擇方法,其特征在于,所述步驟S1中,移動用戶樣本數(shù)據(jù)為電信運(yùn)營商提供的B域數(shù)據(jù)和O域數(shù)據(jù)。
3.根據(jù)權(quán)利要求1所述的一種基于Fisher分和近似馬爾科夫毯的移動用戶出境特征選擇方法,其特征在于,所述步驟S2中,出境特征提取的方法包括:
S21:擷取提供出境服務(wù)的APP數(shù)據(jù),以域名、關(guān)鍵詞為關(guān)聯(lián)條件與移動用戶上網(wǎng)數(shù)據(jù)進(jìn)行關(guān)聯(lián)匹配,得到移動用戶的上網(wǎng)特征G={x1,x2,…,xg};
S22:采集提供出境服務(wù)的通話端口數(shù)據(jù),以對端號碼、城市電話區(qū)號為關(guān)聯(lián)條件與移動用戶通話數(shù)據(jù)進(jìn)行關(guān)聯(lián)匹配,得到移動用戶的通話特征T={x1,x2,…,xt};
S23:采集提供出境服務(wù)的機(jī)構(gòu)位置基站數(shù)據(jù),以地區(qū)區(qū)域碼和基站編碼為關(guān)聯(lián)條件與移動用戶軌跡數(shù)據(jù)進(jìn)行關(guān)聯(lián)匹配,得到移動用戶的出行特征V={x1,x2,…,xv};
S24:過濾移動用戶屬性數(shù)據(jù)中無關(guān)維度,得到移動用戶的靜態(tài)特征U={x1,x2,…,xu}。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于重慶郵電大學(xué),未經(jīng)重慶郵電大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010130947.X/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 一種鑒別原油和燃料油的方法
- 利用混合分量聚類Fisher得分算法提高音頻分類準(zhǔn)確率的方法
- 一種基于Fisher分類器組的離散型數(shù)據(jù)預(yù)處理方法
- 一種基于Fisher分類器組的連續(xù)型數(shù)據(jù)預(yù)處理方法
- 一種基于fisher信息處理短期負(fù)荷預(yù)測特征輸入量的選擇方法
- 一種基于fisher信息處理多維氣象因素短期負(fù)荷處理方法
- 一種基于fisher信息處理的單氣象因素短期負(fù)荷預(yù)測方法
- 基于Fisher-Score違約鑒別能力最大的信用評級最優(yōu)指標(biāo)組合的方法
- 基于Fisher判別分析的矩陣變量受限玻爾茲曼機(jī)圖像分類方法
- 基于特征空間分布的Fisher特征選擇方法
- 一種基于馬爾科夫模型的進(jìn)程時間片長度確定方法
- 一種利用時空馬爾科夫隨機(jī)場模型的視頻超分辨方法
- 基于馬爾科夫鏈的數(shù)控現(xiàn)場總線時鐘同步抖動修正方法
- 一種基于多實(shí)例馬爾科夫模型的行為識別方法
- 一種再入動態(tài)等離子鞘套馬爾科夫信道建模方法
- 一種對冗余系統(tǒng)進(jìn)行可靠性分析的方法
- 一種用可逆單分子反應(yīng)實(shí)現(xiàn)馬爾科夫鏈的設(shè)計方法
- 一種基于大數(shù)據(jù)的三維素材推薦方法
- 基于安卓系統(tǒng)的移動設(shè)備老化重生方法
- 骨密度與骨密度影響因素之間因果關(guān)系的確定方法及系統(tǒng)





