[發明專利]用戶與聯系人間親密度判定方法/系統、存儲介質及設備在審
| 申請號: | 201710595701.8 | 申請日: | 2017-07-20 |
| 公開(公告)號: | CN107871286A | 公開(公告)日: | 2018-04-03 |
| 發明(設計)人: | 唐抒辰;何同國;張鵬 | 申請(專利權)人: | 上海前隆信息科技有限公司 |
| 主分類號: | G06Q50/00 | 分類號: | G06Q50/00 |
| 代理公司: | 上海光華專利事務所(普通合伙)31219 | 代理人: | 徐秋平 |
| 地址: | 200080 上海市虹口*** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 用戶 聯系 人間 親密 判定 方法 系統 存儲 介質 設備 | ||
1.一種用戶與聯系人間親密度判定方法,其特征在于,所述用戶與聯系人間親密度判定方法包括:
針對收集的第一模型樣本進行初始建模,以形成初始親密度模型;所述第一模型樣本包括用戶與聯系人之間聯系變量,和用戶與聯系人之間的親密度目標變量;
對所述初始親密度模型進行變量檢驗,剔除所述第一模型樣本中的無效變量,并在所述第一模型樣本中增加新的聯系變量、或從聯系變量中衍生出的衍生變量,形成第二模型樣本;
針對所述第二模型樣本進行再建模,以形成再建親密度模型,并對所述再建親密度模型進行評估,及打分,獲取親密度分值,根據親密度分值判定出用戶與聯系人間親密度。
2.根據權利要求1所述的用戶與聯系人間親密度判定方法,其特征在于,所述針對收集的模型樣本進行初始建模,以形成初始親密度模型的步驟包括:
建立第一模型樣本的第一棵決策樹,并初始化所述第一模型樣本的第一棵決策樹;所述第一棵決策樹的父節點含有所述模型樣本;
計算所述第一模型樣本的第一棵決策樹上用戶與聯系人之間每個聯系變量的信息增益,選擇各個聯系變量下最大信息增益的分類變量,并生成所述第一棵決策樹上聯系變量的第一預測函數;
計算生成聯系變量的第一預測函數與其對應的親密度目標變量的殘差;
基于該殘差及預設學習率,學習第一模型樣本的第二棵決策樹,并生成所述第二棵決策樹上聯系變量的第二預測函數;
計算生成聯系變量的第二預測函數與其對應的親密度目標變量的殘差;
迭代運行預測函數的生成步驟,殘差的計算步驟,及基于計算的殘差,學習下一棵決策樹的步驟;
將迭代過程中所有決策樹的累和定義為初始親密度模型。
3.根據權利要求1所述的用戶與聯系人間親密度判定方法,其特征在于,所述針對所述第二模型樣本進行再建模,以形成再建親密度模型的步驟包括:
建立第二模型樣本的第一棵決策樹,并初始化所述第二模型樣本的第一棵決策樹;所述第一棵決策樹的父節點含有所述模型樣本;
計算所述第二模型樣本的第一棵決策樹上用戶與聯系人之間每個聯系變量的信息增益,選擇各個聯系變量下最大信息增益的分類變量,并生成所述第一棵決策樹上聯系變量的第一預測函數;
計算生成聯系變量的第一預測函數與其對應的親密度目標變量的殘差;
基于該殘差及預設學習率,學習第二模型樣本的第二棵決策樹,并生成所述第二棵決策樹上聯系變量的第二預測函數;
計算生成聯系變量的第二預測函數與其對應的親密度目標變量的殘差;
迭代運行預測函數的生成步驟,殘差的計算步驟,及基于計算的殘差,學習下一棵決策樹的步驟;
將迭代過程中所有決策樹的累和定義為再建親密度模型。
4.根據權利要求1所述的用戶與聯系人間親密度判定方法,其特征在于,對所述再建親密度模型進行評估的步驟包括:
獲取所述再建親密度模型的模型差別值和模型區分值,并通過所述模型差別值和模型區分值對所述再建親密度模型進行評估;
其中,所述模型差別值表示模型的預測能力與隨機結果的差別;所述模型區分值表示模型區分有效樣本和無效樣本。
5.根據權利要求1所述的用戶與聯系人間親密度的判定方法,其特征在于,所述對所述再建親密度模型進行打分的步驟為將再建親密度模型的函數值轉換為親密度分值。
6.根據權利要求5所述的用戶與聯系人間親密度判定方法,其特征在于,所述將再建親密度模型的函數值轉換為親密度分值的步驟是通過預存打分公式對再建親密度模型的函數值與親密度分值的轉換;
預存打分公式為:
score=a-b*log(odds)
其中,score為親密度分值,p為用戶與聯系人之間的親密度目標變量為1時再建親密度模型的函數值,1-p為用戶與聯系人之間的親密度目標變量為0時再建親密度模型的函數值;a,b為經驗值的常數項。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于上海前隆信息科技有限公司,未經上海前隆信息科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710595701.8/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:保險理賠的處理方法及裝置
- 下一篇:一種創新潛質數據分析系統





