[發明專利]一種基于運營商數據識別大學生網貸風險的分析方法與系統在審
| 申請號: | 201910913601.4 | 申請日: | 2019-09-25 |
| 公開(公告)號: | CN110648222A | 公開(公告)日: | 2020-01-03 |
| 發明(設計)人: | 田科偉 | 申請(專利權)人: | 杭州譜數夢信息技術有限公司 |
| 主分類號: | G06Q40/02 | 分類號: | G06Q40/02;G06F16/2458;G06F16/245;G06F16/28;G06F16/29;G06F16/27;G06K9/62;G06F16/951;G06F16/955 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 310000 浙江省杭州市蕭山*** | 國省代碼: | 浙江;33 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 分析目標 用戶上網 采集 分析 商品詳細信息 用戶上網行為 目標客戶群 運營商數據 爬蟲 方式分析 購物行為 軌跡行為 客戶群體 目標對象 日志數據 上網行為 實時分析 用戶軌跡 用戶群體 預警機制 大數據 基準庫 運營商 大學生 日志 上網 監控 | ||
1.一種基于運營商數據識別大學生網貸風險的分析方法,其特征在于,根據對以往發生的大學生網貸事件分析,獲取大學生網貸的基礎特征為:經常使用網貸APP,線上大宗消費信息,經常搜索貸款、還貸類關鍵詞,線下出現商圈頻次,經常撥打網貸機構客服電話;其分析方法包括以下步驟:
建立基準庫:
APP庫:對網貸APP、電商APP及其對應的HOST域名進行分類;
網貸電話庫:對貸款類客服電話實現匯總;
位置庫:匯總高校及商場的位置POI信息;
網貸搜索詞庫:匯集運營商用戶網絡貸款搜索詞;
目標群體識別:通過高校的位置POI信息,結合高校覆蓋范圍內的基站工參數據,采集運營商用戶軌跡行為數據,比對運營商用戶資料數據,實現對大學生群體的識別;
目標群體行為數據解析:
將目標用戶上網日志、基準庫數據加載到HDFS,采用M/R實現海量數據快速高效匹配,解析出用戶上網具體URL行為、APP行為、網貸APP點擊次數;獲取用戶購買商品數據通過電商APP深度解析出來的用戶購買商品編號,通過爬蟲實現內容爬取識別商品的詳細信息;解析用戶的搜索詞信息,將APP站內搜索與主流搜索引擎搜索詞進行匯總;
通過商場的位置POI信息,結合商場覆蓋范圍內的基站工參數據,采集目標用戶軌跡行為數據,解析目標群體在商場出現的頻率;
結合網貸電話庫,獲取目標用戶網貸電話撥打記錄;
所述基站工參數據包括基站名稱、LAC/CI、經緯度、基站類型;運營商用戶軌跡行為數據包括電話號碼、開始基站、結束基站、開始時間、結束時間、信令動作;運營商用戶資料數據包括電話號碼、年齡、性別、網齡、機齡;目標用戶上網日志包括上網開始時間、結束時間、電話號碼、HOST、URL;
網貸風險模型建立:
通過貝葉斯分類實現對具備大學生網貸特征的用戶群體實現特征分析,輸出具備網貸風險的特征,建立模型分析維度:
其中規則總分100分,按照分數輸出網貸風險等級;風險等級=規則總數/30;風險等級>1為高風險等級;0.5<風險等級<1為中等風險等級;0<風險等級<0.5低風險等級。
2.根據權利要求1所述一種基于運營商數據識別大學生網貸風險的分析方法,其特征在于,還包括將高風險等級消息通知高校管理員或家長。
3.根據權利要求1所述一種基于運營商數據識別大學生網貸風險的分析方法,其特征在于,還包括目標用戶上網日志數據清,洗掉HTTP/WAP協議的URL和域名不符合、對應的URL包括有擴展名和沒有擴展名形式的地址數據。
4.根據權利要求1所述一種基于運營商數據識別大學生網貸風險的分析方法,其特征在于,還包括用戶資料數據清洗,洗掉外省注冊的號碼。
5.根據權利要求1所述一種基于運營商數據識別大學生網貸風險的分析方法,其特征在于,所述高校為本省高校;所述商圈為本省重點商圈。
6.根據權利要求1所述一種基于運營商數據識別大學生網貸風險的分析方法,其特征在于,所述高校及商場的位置POI信息通過百度地圖,實現區域范圍的經緯度爬取。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于杭州譜數夢信息技術有限公司,未經杭州譜數夢信息技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910913601.4/1.html,轉載請聲明來源鉆瓜專利網。





