[發明專利]基于社會網絡分析技術的數據挖掘的一種方法在審
| 申請號: | 202110704883.4 | 申請日: | 2021-06-24 |
| 公開(公告)號: | CN113408207A | 公開(公告)日: | 2021-09-17 |
| 發明(設計)人: | 祖玉寧 | 申請(專利權)人: | 上海碩恩網絡科技股份有限公司 |
| 主分類號: | G06F30/27 | 分類號: | G06F30/27;G06Q40/02;G06F16/2458;G06F16/28;G06F16/35;G06F40/30;G06F16/951;G06F9/50 |
| 代理公司: | 北京貴都專利代理事務所(普通合伙) 11649 | 代理人: | 李新鋒 |
| 地址: | 200030 上海市*** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 社會 網絡分析 技術 數據 挖掘 一種 方法 | ||
1.基于社會網絡分析技術的數據挖掘的一種方法,其特征在于,包括:征信風控建模、特征變量庫、仿真數據庫以及場景變量數據挖掘四個模塊;
所述征信風控建模的具體操作步驟如下:
S1.準備數據,收集存量數據樣本;
S2.對數據樣本進行預處理,根據數據樣本的屬性建立特征變量寬表數據集;
S3.對所述數據集進行劃分,將數據集劃分成訓練集、測試集和驗證集;
S4.建立訓練模型;
S5.使用訓模型訓練,并調整損失函數和優化器;
S6.評分卡生成,使用S2中所述測試機評估訓練模型的測試準確度;
S7.公布,并在業務場景中應用;
S8.應用的數據沉淀并反饋至S1處進入收集的樣本中;
所述特征變量庫用于根據所述信貸客戶的行為數據構造行為序列,并生成特征向量;所述特征變量庫以提取出所述信貸客戶的屬性特征變量、關系特征變量、行為特征變量以及規則變量,并根據所述屬性特征變量、關系特征變量、行為特征變量以及規則變量構建特征變量表;
所述仿真數據庫是嚴格按照數據源格式,人工制作的高度仿真真實數據的數據集;
所述場景變量數據挖掘的具體步驟如下:獲取行為特征查詢語句,所述行為特征查詢語句中包括請求查詢的行為特征信息;在標注場景數據庫中查詢與所述行為特征信息對應的標注場景數據;根據查詢到的標注場景數據對應的時間標簽,從原始場景數據庫中提取查詢到的場景數據,生成特征場景數據。
2.根據權利要求1所述的基于社會網絡分析技術的數據挖掘的一種方法,其特征在于,所述數據樣本包括用戶的基本信息數據,銀行交易流水信息數據,產品持有信息數據,征信數據。
3.根據權利要求1所述的基于社會網絡分析技術的數據挖掘的一種方法,其特征在于,該方法還包括征信風控評分卡建模,所述征信風控評分卡建模包括客戶信息采集模塊以及信用評分模型建立模塊,客戶信息采集模塊用于采集客戶的信用歷史、行為偏好、履約能力、身份特質以及人脈關系。
4.根據權利要求3所述的基于社會網絡分析技術的數據挖掘的一種方法,其特征在于,客戶信息采集模塊包括搜索引擎以及存儲單元,用于根據借款人提交的年齡、收入、職業、學歷、資產、負債信息,并查詢系統里的相關征信數據,并記錄到存儲單元內;客戶信息采集模塊包括爬蟲引擎,爬蟲引擎用于根據借款人的信息到互聯網上實時、不間斷抓取社交、電商、通信、出行等互聯網數據,經過處理后存并記錄到存儲單元內;征信風控評分卡建模通過基于深度學習,組合多種算法,構建出十幾個風控模型,發現有區分用戶風險的特性,進而建立模型,對用戶進行打分,計算平均違約率。
5.根據權利要求1所述的基于社會網絡分析技術的數據挖掘的一種方法,其特征在于,所述仿真數據庫通過在網站或者移動端嵌入設備識別腳本,獲取客戶手機的位置信息以及社交活動軌跡,用于識別出用戶是否存在經常換手機卡、刻意隱藏個人信息、短期內故意暴露個人信息等情況。
6.根據權利要求1所述的基于社會網絡分析技術的數據挖掘的一種方法,其特征在于,所述特征變量庫是將原始數據轉化為特征的過程,這些特征可以更好地向預測模型描述潛在問題,從而提高模型對未見數據的精準識別能力。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于上海碩恩網絡科技股份有限公司,未經上海碩恩網絡科技股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110704883.4/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種商用車同步器壽命的實時監測方法及監測裝置
- 下一篇:功率半導體器件





