[發明專利]一種家庭關系挖掘方法和裝置在審
| 申請號: | 202110505815.5 | 申請日: | 2021-05-10 |
| 公開(公告)號: | CN113159929A | 公開(公告)日: | 2021-07-23 |
| 發明(設計)人: | 黃發培;韓忠秋;胡汝敖;王霞;張佳佳;鄒浩;錢程;尹濤;熊瀟;李沁洋;呂亮 | 申請(專利權)人: | 中國建設銀行股份有限公司 |
| 主分類號: | G06Q40/02 | 分類號: | G06Q40/02;G06K9/62;G06N20/00;G06N3/08 |
| 代理公司: | 北京三友知識產權代理有限公司 11127 | 代理人: | 賈磊;李輝 |
| 地址: | 100033 *** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 家庭 關系 挖掘 方法 裝置 | ||
1.一種家庭關系挖掘方法,其特征在于,包括:
獲取已有配偶關系數據;
根據已有配偶關系數據,對特征值進行篩選,確定特征值集合;
根據特征值集合,對準備訓練數據進行挖掘,確定訓練數據;
根據訓練數據,對機器學習模型進行訓練,確定訓練后機器學習模型;
根據訓練后機器學習模型,進行家庭關系挖掘。
2.如權利要求1所述的方法,其特征在于,獲取已有配偶關系數據,包括:
連接個貸系統,獲取個人住房貸款信息;
分析人住房貸款信息,獲取以后配偶關系數據。
3.如權利要求2所述的方法,其特征在于,獲取已有配偶關系數據,還包括:
連接銀行客戶管理系統,獲取包含性別、年齡、名族、客戶所屬機構、婚姻狀況、子女狀況、學歷、居住狀況、家庭人口數和職業的客戶基本屬性信息;
從客戶基本屬性信息中篩選出婚姻狀況作為已有配偶關系數據。
4.如權利要求2所述的方法,其特征在于,獲取已有配偶關系數據,還包括:
連接客戶關系管理系統和客戶信息信息系統,獲取客戶AUM值;
根據客戶AUM值,獲取已有配偶關系數據。
5.如權利要求1所述的方法,其特征在于,根據已有配偶關系數據,對特征值進行篩選,確定特征值集合,包括:
根據分類算法,預選出多個特征值;
根據已有配偶關系數據對預選出的特征值進行統計,確定特征值與配偶關系的相關性;
根據特征值與配偶關系的相關性,從多個特征值中篩選出特征值集合。
6.如權利要求5所述的方法,其特征在于,特征值集合,包括:
雙方的轉賬次數、雙方的性別差異、雙方的年齡差距、雙方的民族差異、雙方的學歷差距、雙方所屬機構號差距、雙方婚姻狀況的差異、雙方子女狀況的差異、雙方居住狀況的差異以及雙方家庭人口數的差異。
7.如權利要求6所述的方法,其特征在于,從多個特征值中篩選出雙方的學歷差距,包括:
將雙方學歷進行數值化,確定數值化學歷;
取數值化學歷的前兩位相減后取絕對值,確定學歷差異;
將學歷差異和家庭數量建立直方圖,當直方圖滿足雙方文化程度的差異越小越容易組建家庭的條件時,將雙方的學歷差距作為相關特征值從多個預選出的特征值中篩選出來,送入特征值集合。
8.如權利要求1所述的方法,其特征在于,根據特征值集合,對準備訓練數據進行挖掘,確定訓練數據,包括:
對特征值集合進行缺失值處理,確定完整化特征值集合;
根據完整化特征值集合,對準備訓練數據進行挖掘,確定特征數據;
將特征數據用轉賬關系里面的兩個客戶去關聯已有配偶關系數據,確定訓練數據。
9.如權利要求8所述的方法,其特征在于,對特征值集合進行缺失值處理時,
當特征值屬于數值型數據時,采用歸一化處理方式進行處理;
當特征值屬于類型數據時,采用one-hot編碼處理方式進行處理。
10.如權利要求1所述的方法,其特征在于,根據訓練數據,對機器學習模型進行訓練,確定訓練后機器學習模型,包括:
將訓練數據分為訓練集、驗證集和測試集;
將訓練集導入機器學習模型進行訓練;
在訓練的過程中,監測機器學習模型參數的變化,通過驗證集確定模型參數,通過測試集對機器學習模型性能進行評估;
根據模型參數和模型性能,輸出訓練后機器學習模型。
11.如權利要求10所述的方法,其特征在于,在將訓練集導入機器學習模型進行訓練時,采用大數據SPARK ML機器學習庫對數據進行并行訓練,利用集群的計算能力,加速模型訓練的速度。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國建設銀行股份有限公司,未經中國建設銀行股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110505815.5/1.html,轉載請聲明來源鉆瓜專利網。





