[發明專利]個人信用數據處理方法和裝置在審
| 申請號: | 201510272415.9 | 申請日: | 2015-05-25 |
| 公開(公告)號: | CN104866969A | 公開(公告)日: | 2015-08-26 |
| 發明(設計)人: | 韓博 | 申請(專利權)人: | 百度在線網絡技術(北京)有限公司 |
| 主分類號: | G06Q10/06 | 分類號: | G06Q10/06 |
| 代理公司: | 北京品源專利代理有限公司 11332 | 代理人: | 孟金喆;胡彬 |
| 地址: | 100085 北京市*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 個人信用 數據處理 方法 裝置 | ||
1.一種個人信用數據處理方法,其特征在于,包括:
采集用于評價用戶個人信用的原始數據;
將各用戶的所述原始數據進行轉化處理,以形成規范化個人數據;
基于所述規范化個人數據形成個人信用評估模型;
基于所述個人信用評估模型,對所述用戶的個人信用進行評估。
2.根據權利要求1所述的方法,其特征在于,采集用于評價用戶個人信用的原始數據包括:
通過下述至少一種形式采集用于評價用戶個人信用的原始數據:
采集用戶在機構、客戶端或網站中的注冊信息,提取所述注冊信息中的字段內容,作為所述原始數據;
采集用戶在網絡中的云備份信息,作為所述原始數據;
采集用戶在機構、客戶端或網站中進行操作的行為模式數據,作為所述原始數據;
采集設定機構數據庫中對所述用戶的評價信息、資質信息、教育經歷信息以及工作經歷信息;
采集客戶端或網絡中對所述用戶的反饋數據。
3.根據權利要求2所述的方法,其特征在于:
所述注冊信息包括下述至少一項:姓名、證件號、籍貫、年齡、性別、以及學歷;
所述云備份信息包括下述至少一項:通訊錄數據、電子郵件、短信以及照片;
所述行為模式數據包括下述至少一項:共享發布數據、定位數據、搜索數據、瀏覽數據、收入數據、消費數據、電話通訊數據、短信交互數據、電子郵件數據以及服務行為數據;
所述反饋數據包括下述至少一項:反饋評分和用戶點評。
4.根據權利要求1所述的方法,其特征在于,將各用戶的所述原始數據進行轉化處理,以形成規范化個人數據包括:
對所述原始數據進行語義識別,基于語義識別結果進行去重處理和/或糾錯處理,以形成規范化個人數據。
5.根據權利要求1所述的方法,其特征在于,將各用戶的所述原始數據進行轉化處理,以形成規范化個人數據包括:
對于所述原始數據中的瀏覽數據和搜索數據,以瀏覽和搜索所涉及的關鍵詞為瀏覽內容和搜索行為添加語義標簽;
根據所述語義標簽進行聚類,以確定聚類標簽;
根據所述聚類標簽以及所述瀏覽數據和搜索數據,為所述用戶確定興趣標簽及所述興趣標簽的權重,以形成規范化個人數據。
6.根據權利要求1所述的方法,其特征在于,將各用戶的所述原始數據進行轉化處理,以形成規范化個人數據包括:
根據所述原始數據中的用戶通訊交互數據的入度和出度,將入度和/或出度達到設定門限值的社交連接點確定為活躍有效社交連接點;
根據用戶與所述活躍有效社交連接點之間的交互數據,確定所述用戶的社交網絡穩定性。
7.根據權利要求1所述的方法,其特征在于,將各用戶的所述原始數據進行轉化處理,以形成規范化個人數據包括:
根據所述原始數據中的定位數據,確定所述用戶的歷史軌跡;
根據所述用戶的歷史軌跡確定所述用戶的活動地點坐標的離散程度,以及居住地點變更頻率;
根據所述活動地離散程度和所述居住地變更頻率確定所述用戶的社會活動空間軌跡穩定性。
8.根據權利要求1所述的方法,其特征在于,將各用戶的所述原始數據進行轉化處理,以形成規范化個人數據包括:
根據所述原始數據中用戶的收入數據以及消費數據,確定所述用戶的經濟能力等級、風險承擔能力和消費傾向。
9.根據權利要求1所述的方法,其特征在于,基于所述規范化個人數據形成個人信用評估模型包括:
從至少兩個設定維度提取用戶的規范化個人數據,并根據設定標準,建立正例樣本庫和反例樣本庫,將正例樣本庫和反例樣本庫的樣本分別劃分為學習級和測試組;
基于設定置信度閾值,基于SPARSE?CODING結合ADABOOST算法,從各所述樣本中排除非必要特征;
對于設定的不同行業,根據主成分分析算法篩選建立對應行業模型的數據特征;
基于所述數據屬性建立線性多項式形式的行業模型,通過所述正例樣本庫和反例樣本庫的學習組樣本進行學習,以確定各數據屬性的權重;
采用測試組樣本對所述行業模型的參數進行測試,以確定所述行業模型,作為該行業的個人信用評估模型。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于百度在線網絡技術(北京)有限公司,未經百度在線網絡技術(北京)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201510272415.9/1.html,轉載請聲明來源鉆瓜專利網。
- 同類專利
- 專利分類
G06Q 專門適用于行政、商業、金融、管理、監督或預測目的的數據處理系統或方法;其他類目不包含的專門適用于行政、商業、金融、管理、監督或預測目的的處理系統或方法
G06Q10-00 行政;管理
G06Q10-02 .預定,例如用于門票、服務或事件的
G06Q10-04 .預測或優化,例如線性規劃、“旅行商問題”或“下料問題”
G06Q10-06 .資源、工作流、人員或項目管理,例如組織、規劃、調度或分配時間、人員或機器資源;企業規劃;組織模型
G06Q10-08 .物流,例如倉儲、裝貨、配送或運輸;存貨或庫存管理,例如訂貨、采購或平衡訂單
G06Q10-10 .辦公自動化,例如電子郵件或群件的計算機輔助管理





