[發明專利]基于圖計算及社區劃分算法區分信貸用戶的方法及系統在審
| 申請號: | 202010773948.6 | 申請日: | 2020-08-04 |
| 公開(公告)號: | CN111915426A | 公開(公告)日: | 2020-11-10 |
| 發明(設計)人: | 陳德建;崔巖莉 | 申請(專利權)人: | 中投國信(北京)科技發展有限公司 |
| 主分類號: | G06Q40/02 | 分類號: | G06Q40/02;G06N20/00 |
| 代理公司: | 北京魚爪知識產權代理有限公司 11754 | 代理人: | 吳云 |
| 地址: | 100160 北京市豐臺區*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 計算 社區 劃分 算法 區分 信貸 用戶 方法 系統 | ||
1.基于圖計算及社區劃分算法區分信貸用戶的方法,其特征在于,包括以下步驟:
S100:獲取信貸用戶的ssid、身份證號碼和當前所在經緯度;
S200:通過清洗ssid和身份證號碼前六位獲取信貸用戶的戶籍所在縣,根據經緯度獲取信貸用戶當前所在的城市及區縣;
S300:根據所述經緯度把商場的ssid剔除,把剩余的ssid記錄并存儲;
S400:根據剩余的ssid,采用圖計算的數據結構構建知識圖譜,對相同的ssid作關聯標注,并標注為同事,對剩余的ssid相同戶籍所在地作關聯標注,并標注為老鄉,對剩余的ssid相同經緯度作關聯標注,并標注為同縣區;
S500:通過對知識圖譜進行隨機游走序列把關聯標注的關系生成embedding;
S600:按照社區劃分算法對embedding進行切割,得到多個社群;
S700:對社群進行標注,標注的社區里面超過第一閾值違約的為壞用戶社群,把低于第二閾值違約社群標注為好社群。
2.根據權利要求1所述的基于圖計算及社區劃分算法區分信貸用戶的方法,其特征在于,還包括步驟S800:用常規機器學習算法xgboost進行訓練,在知識圖譜中,兩個節點之間作關聯標注的為關系向量,把社群中關系向量作為訓練樣本,好社群和壞社群標注作為目標target進行訓練。
3.根據權利要求2所述的基于圖計算及社區劃分算法區分信貸用戶的方法,其特征在于,還包括步驟S900:訓練之后生成模型,當一個用戶申請時先劃分到社群,進行關系embedding,代入訓練好的模型進行預測。
4.根據權利要求1所述的基于圖計算及社區劃分算法區分信貸用戶的方法,其特征在于,在步驟S500中,生成embedding的方法包括采用node2vec算法。
5.根據權利要求1所述的基于圖計算及社區劃分算法區分信貸用戶的方法,其特征在于,在步驟S700中,所述第一閾值為70%,所述第二閾值為10%。
6.基于圖關系社群切分后區分信貸用戶好壞的系統,其特征在于,包括:
基本信息獲取模塊:用于獲取信貸用戶的ssid、身份證號碼和當前所在經緯度;
地區獲取模塊:用于通過清洗ssid和身份證號碼前六位獲取信貸用戶的戶籍所在縣,根據經緯度獲取信貸用戶當前所在的城市及區縣;
剔除模塊:用于根據所述經緯度把商場的ssid剔除,把剩余的ssid記錄并存儲;
關聯標注模塊:用于根據剩余的ssid,采用圖計算的數據結構構建知識圖譜,對相同的ssid作關聯標注,并標注為同事,對剩余的ssid相同戶籍所在地作關聯標注,并標注為老鄉,對剩余的ssid相同經緯度作關聯標注,并標注為同縣區;
Embedding生成模塊:用于通過對知識圖譜進行隨機游走序列把關聯標注的關系生成embedding;
切割模塊:用于按照社區劃分算法對embedding進行切割,得到多個社群;
社群劃分模塊:對社群進行標注,標注的社區里面超過第一閾值違約的為壞用戶社群,把低于第二閾值違約社群標注為好社群。
7.根據權利要求6所述的基于圖關系社群切分后區分信貸用戶好壞的系統,其特征在于,還包括:
訓練模塊:用于用常規機器學習算法xgboost進行訓練,在知識圖譜中,兩個節點之間作關聯標注的為關系向量,把社群中關系向量作為訓練樣本,好社群和壞社群標注作為目標target進行訓練。
8.根據權利要求7所述的基于圖關系社群切分后區分信貸用戶好壞的系統,其特征在于,還包括:
預測模塊:用于訓練之后生成模型,當一個用戶申請時先劃分到社群,進行關系embedding,代入訓練好的模型進行預測。
9.根據權利要求6所述的基于圖關系社群切分后區分信貸用戶好壞的系統,其特征在于,所述Embedding生成模塊中,生成embedding的方法包括采用node2vec算法。
10.根據權利要求6所述的基于圖關系社群切分后區分信貸用戶好壞的系統,其特征在于,所述社群劃分模塊中,所述第一閾值為70%,所述第二閾值為10%。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中投國信(北京)科技發展有限公司,未經中投國信(北京)科技發展有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010773948.6/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:用于共用GPU的方法、裝置、電子設備及可讀存儲介質
- 下一篇:斷路器





