[發明專利]一種基于Fisher分和近似馬爾科夫毯的移動用戶出境特征選擇方法有效
| 申請號: | 202010130947.X | 申請日: | 2020-02-28 |
| 公開(公告)號: | CN111339165B | 公開(公告)日: | 2022-06-03 |
| 發明(設計)人: | 許國良;張軒;王超;李萬林;雒江濤;易燕 | 申請(專利權)人: | 重慶郵電大學 |
| 主分類號: | G06F16/2458 | 分類號: | G06F16/2458;G06K9/62 |
| 代理公司: | 北京同恒源知識產權代理有限公司 11275 | 代理人: | 趙榮之 |
| 地址: | 400065 *** | 國省代碼: | 重慶;50 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 fisher 近似 馬爾科夫毯 移動用戶 出境 特征 選擇 方法 | ||
1.一種基于Fisher分和近似馬爾科夫毯的移動用戶出境特征選擇方法,其特征在于,該方法包括以下步驟:
S1:獲取移動用戶樣本的上網、通話、軌跡和屬性數據,對用戶樣本進行打標,構建訓練集和測試集;
S2:利用提供出境服務的APP、電話、機構位置基站信息提取用戶樣本的出境特征,對特征集歸一化處理;
S3:根據Fisher分剔除出境特征集中不相關的特征,獲得Fisher候選特征集;
S4:設計融合最大的互信息值和對稱不確定性的相關性度量標準MSCC,剔除Fisher候選特征集中不相關的特征,獲得MSCC候選特征集;
S5:利用近似Markov-Blanket剔除MSCC候選特征集中的冗余特征,獲得最優出境特征子集;
S6:利用集成學習思想構建分類模型,完成待測樣本的分類;
分類模型的構建方法包括:
S61:分類模型設計為兩層結構,第一層分別采用KNN、LightGBM、邏輯回歸、AdaBoost算法構建基分類器,第二層采用隨機森林算法構建次級分類器;
S62:采用交叉驗證的方式,四個基分類器分別對最優特征集合進行學習和預測,最終得到基分類器對訓練集的預測結果T1,對測試集的預測結果T2;
S63:將T1作為訓練集,T2作為測試集,然后輸入次級分類器中進行學習和預測,得到最終的預測結果。
2.根據權利要求1所述的一種基于Fisher分和近似馬爾科夫毯的移動用戶出境特征選擇方法,其特征在于,所述步驟S1中,移動用戶樣本數據為電信運營商提供的B域數據和O域數據。
3.根據權利要求1所述的一種基于Fisher分和近似馬爾科夫毯的移動用戶出境特征選擇方法,其特征在于,所述步驟S2中,出境特征提取的方法包括:
S21:擷取提供出境服務的APP數據,以域名、關鍵詞為關聯條件與移動用戶上網數據進行關聯匹配,得到移動用戶的上網特征G={x1,x2,…,xg};
S22:采集提供出境服務的通話端口數據,以對端號碼、城市電話區號為關聯條件與移動用戶通話數據進行關聯匹配,得到移動用戶的通話特征T={x1,x2,…,xt};
S23:采集提供出境服務的機構位置基站數據,以地區區域碼和基站編碼為關聯條件與移動用戶軌跡數據進行關聯匹配,得到移動用戶的出行特征V={x1,x2,…,xv};
S24:過濾移動用戶屬性數據中無關維度,得到移動用戶的靜態特征U={x1,x2,…,xu}。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于重慶郵電大學,未經重慶郵電大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010130947.X/1.html,轉載請聲明來源鉆瓜專利網。





