[發(fā)明專利]基于圖計算及社區(qū)劃分算法區(qū)分信貸用戶的方法及系統(tǒng)在審
| 申請?zhí)枺?/td> | 202010773948.6 | 申請日: | 2020-08-04 |
| 公開(公告)號: | CN111915426A | 公開(公告)日: | 2020-11-10 |
| 發(fā)明(設(shè)計)人: | 陳德建;崔巖莉 | 申請(專利權(quán))人: | 中投國信(北京)科技發(fā)展有限公司 |
| 主分類號: | G06Q40/02 | 分類號: | G06Q40/02;G06N20/00 |
| 代理公司: | 北京魚爪知識產(chǎn)權(quán)代理有限公司 11754 | 代理人: | 吳云 |
| 地址: | 100160 北京市豐臺區(qū)*** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 基于 計算 社區(qū) 劃分 算法 區(qū)分 信貸 用戶 方法 系統(tǒng) | ||
本發(fā)明公開了基于圖計算及社區(qū)劃分算法區(qū)分信貸用戶的方法及系統(tǒng),涉及信貸技術(shù)領(lǐng)域,本發(fā)明根據(jù)信貸用戶的ssid、身份證號碼和當前所在經(jīng)緯度信息,即可獲得信貸用戶的戶籍所在縣以及用戶當前所在的城市及區(qū)縣;根據(jù)經(jīng)緯度把商場的ssid剔除,剩余的ssid采用圖計算的數(shù)據(jù)結(jié)構(gòu)構(gòu)建知識圖譜,兩個相關(guān)聯(lián)的節(jié)點進行連線并作關(guān)聯(lián)標注,標注為同事、老鄉(xiāng)或同縣區(qū),采用圖計算的數(shù)據(jù)結(jié)構(gòu)構(gòu)建知識圖譜,通過對知識圖譜進行隨機游走序列把關(guān)聯(lián)標注的關(guān)系生成embedding;按照社區(qū)劃分算法對embedding進行切割,得到多個社群;再對社群進行標注劃分以區(qū)分社群的好壞。本發(fā)明使得實行手工賬管理的非常簡單,便于聯(lián)社對基層社發(fā)生的每筆業(yè)務(wù)進行有效的監(jiān)控,區(qū)分信貸用戶的好壞。
技術(shù)領(lǐng)域
本發(fā)明涉及信貸技術(shù)領(lǐng)域,具體而言,涉及基于圖計算及社區(qū)劃分算法區(qū)分信貸用戶的方法及系統(tǒng)。
背景技術(shù)
信貸是指以償還和付息為條件的價值運動形式。通常包括銀行存款、貸款等信用活動,狹義上僅指銀行貸款,廣義上同“信用”通用。信貸是用有償方式動員和分配資金的重要形式,是發(fā)展經(jīng)濟的有力杠桿。
信貸是農(nóng)村信用社運用資金取得效益最主要的途徑,貸款質(zhì)量的高低,直接關(guān)系到農(nóng)村信用社的生存和發(fā)展。但由于農(nóng)村信用社網(wǎng)點多、分布散、貸款筆數(shù)多、信貸員素質(zhì)水平各異等原因,使得實行手工賬管理的難度非常大,聯(lián)社無法對基層社發(fā)生的每筆業(yè)務(wù)進行有效的監(jiān)控,如何區(qū)分信貸用戶的好壞成為急需解決的問題。
發(fā)明內(nèi)容
為了克服上述問題或者至少部分地解決上述問題,本發(fā)明實施例提供基于圖計算及社區(qū)劃分算法區(qū)分信貸用戶的方法及系統(tǒng),以便于區(qū)分信貸用戶的好壞。
本發(fā)明的實施例是這樣實現(xiàn)的:
第一方面,本發(fā)明提供一種基于圖計算及社區(qū)劃分算法區(qū)分信貸用戶的方法,包括以下步驟:
S100:獲取信貸用戶的ssid、身份證號碼和當前所在經(jīng)緯度;
S200:通過清洗ssid和身份證號碼前六位獲取信貸用戶的戶籍所在縣,根據(jù)經(jīng)緯度獲取信貸用戶當前所在的城市及區(qū)縣;
S300:根據(jù)經(jīng)緯度把商場的ssid剔除,把剩余的ssid記錄并存儲;
S400:根據(jù)剩余的ssid,采用圖計算的數(shù)據(jù)結(jié)構(gòu)構(gòu)建知識圖譜,對相同的ssid作關(guān)聯(lián)標注,并標注為同事,對剩余的ssid相同戶籍所在地作關(guān)聯(lián)標注,并標注為老鄉(xiāng),對剩余的ssid相同經(jīng)緯度作關(guān)聯(lián)標注,并標注為同縣區(qū);
S500:通過對知識圖譜進行隨機游走序列把關(guān)聯(lián)標注的關(guān)系生成embedding;
S600:按照社區(qū)劃分算法對embedding進行切割,得到多個社群;
S700:對社群進行標注,標注的社區(qū)里面超過第一閾值違約的為壞用戶社群,把低于第二閾值違約社群標注為好社群。
在本發(fā)明的一些實施例中,還包括步驟S800:用常規(guī)機器學習算法xgboost進行訓練,在知識圖譜中,兩個節(jié)點之間作關(guān)聯(lián)標注的為關(guān)系向量,把社群中關(guān)系向量作為訓練樣本,好社群和壞社群標注作為目標target進行訓練。
在本發(fā)明的一些實施例中,還包括步驟S900:訓練之后生成模型,當一個用戶申請時先劃分到社群,進行關(guān)系embedding,代入訓練好的模型進行預測。
在本發(fā)明的一些實施例中,在步驟S500中,生成embedding的方法包括采用node2vec算法。
在本發(fā)明的一些實施例中,在步驟S700中,第一閾值為70%,第二閾值為10%。
第二方面,本發(fā)明還提供一種基于圖關(guān)系社群切分后區(qū)分信貸用戶好壞的系統(tǒng),包括:
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于中投國信(北京)科技發(fā)展有限公司,未經(jīng)中投國信(北京)科技發(fā)展有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010773948.6/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06Q 專門適用于行政、商業(yè)、金融、管理、監(jiān)督或預測目的的數(shù)據(jù)處理系統(tǒng)或方法;其他類目不包含的專門適用于行政、商業(yè)、金融、管理、監(jiān)督或預測目的的處理系統(tǒng)或方法
G06Q40-00 金融;保險;稅務(wù)策略;公司或所得稅的處理
G06Q40-02 .銀行業(yè),例如,利息計算、信貸審批、抵押、家庭銀行或網(wǎng)上銀行
G06Q40-04 .交易,例如,股票、商品、金融衍生工具或貨幣兌換
G06Q40-06 .投資,例如,金融工具、資產(chǎn)組合管理或者基金管理
G06Q40-08 .保險,例如,風險分析或養(yǎng)老金





