[發明專利]目標類型用戶的識別方法、裝置、電子設備及存儲介質有效
| 申請號: | 201910967496.2 | 申請日: | 2019-10-12 |
| 公開(公告)號: | CN110728323B | 公開(公告)日: | 2022-06-21 |
| 發明(設計)人: | 郭延祥;王灣灣;姚明 | 申請(專利權)人: | 中誠信征信有限公司 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62 |
| 代理公司: | 北京柏杉松知識產權代理事務所(普通合伙) 11413 | 代理人: | 項京;高鶯然 |
| 地址: | 100011 北京*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 目標 類型 用戶 識別 方法 裝置 電子設備 存儲 介質 | ||
1.一種目標類型用戶的識別方法,其特征在于,所述方法包括:
獲得待識別用戶的用戶行為數據;
從所述用戶行為數據中,提取所述待識別用戶的用戶行為特征;
將所述待識別用戶的用戶行為特征和第一變量值輸入到預先訓練好的用戶識別模型中;所述用戶識別模型為:針對目標類型用戶對應的目標行為,預先用實驗組訓練樣本的用戶行為特征和第一變量值,及對照組訓練樣本的用戶行為特征和第二變量值訓練好的凈提升模型Uplift Model;所述實驗組訓練樣本的用戶行為特征和對照組訓練樣本的用戶行為特征分別為從實驗組訓練樣本的用戶行為數據和對照組訓練樣本的用戶行為數據中提取的;所述實驗組訓練樣本的用戶行為數據為:滿足預設條件的情況下,用戶執行目標行為的正樣本數據或不執行目標行為的負樣本數據;所述對照組訓練樣本的用戶行為數據為:不滿足預設條件的情況下,用戶執行目標行為的正樣本數據或不執行目標行為的負樣本數據;
獲取用戶識別模型輸出的用戶執行所述目標行為的第一預測概率;
將所述待識別用戶的用戶行為特征和第二變量值輸入到所述用戶識別模型中;
獲取用戶識別模型輸出的用戶執行所述目標行為的第二預測概率;
計算所述第一預測概率與所述第二預測概率的差值作為在只有滿足預設條件的情況下,用戶執行所述目標行為的條件預測概率;
判斷所述條件預測概率是否大于預設的閾值;
如果是,則確定所述待識別用戶為目標類型用戶;
其中,所述用戶識別模型的訓練過程包括:
將實驗組樣本的用戶行為數據標記為實驗組,將對照組樣本的用戶行為數據標記為對照組;
將實驗組樣本的用戶行為數據和對照組樣本的用戶行為數據合并為數據集;
按預設比例抽取數據集中的樣本,構成訓練樣本集;所述訓練樣本集中包含實驗組訓練樣本和對照組訓練樣本;
獲得從實驗組訓練樣本的用戶行為數據和對照組訓練樣本的用戶行為數據中提取的用戶行為特征的交集,作為輸入當前初始用戶識別模型的用戶行為特征;
獲得針對實驗組訓練樣本預設的第一變量值和針對對照組訓練樣本預設的第二變量值;所述第一變量值,用于標識該樣本為實驗組訓練樣本;所述第二變量值用于標識該樣本為對照組訓練樣本;
將各個實驗組訓練樣本的用戶行為特征和第一變量值,輸入到當前初始用戶識別模型中,獲得當前初始用戶識別模型輸出的用戶執行目標行為的第一預測概率;
將各個對照組訓練樣本的用戶行為特征和第二變量值,輸入到當前初始用戶識別模型中,獲得當前初始用戶識別模型輸出的用戶執行目標行為的第二預測概率;
根據各個實驗組訓練樣本的用戶行為數據中是否執行目標行為的真實結果、第一預測概率,以及各個對照組訓練樣本的用戶行為數據中是否執行目標行為的真實結果、第二預測概率和預設的損失函數,計算損失值;
根據預設的損失函數的損失值判斷當前初始用戶識別模型是否收斂;
如果收斂,則確定當前初始用戶識別模型為訓練完成的用戶識別模型;
如果未收斂,則調整當前初始用戶識別模型的模型參數,返回所述將各個實驗組訓練樣本的用戶行為特征和第一變量值,輸入到當前初始用戶識別模型中,獲得當前初始用戶識別模型輸出的用戶執行目標行為的第一預測概率的步驟。
2.根據權利要求1所述的方法,其特征在于,所述當前初始用戶識別模型的模型函數為:
其中,α,β,γ,δ為待訓練的模型的模型參數;Xi為用戶行為特征;Ti為第一變量值或第二變量值;E(Yi|Xi)為用戶執行目標行為的第一預測概率或第二預測概率;
所述預設的損失函數為:
cost(hθ(x),y)=∑(-y(log(hθ(x))-(1-y)log(1-hθ(x)))+λ∑(|α|+|β|+|γ|+|δ|);
其中,λ懲罰系數為經驗值;α,β,γ,δ為待訓練的模型的模型參數;hθ(x)為用戶執行目標行為的第一預測概率或第二預測概率;y為用戶是否執行目標行為的真實結果。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中誠信征信有限公司,未經中誠信征信有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910967496.2/1.html,轉載請聲明來源鉆瓜專利網。





