[發明專利]目標類型用戶的識別方法、裝置、電子設備及存儲介質有效
| 申請號: | 201910967496.2 | 申請日: | 2019-10-12 |
| 公開(公告)號: | CN110728323B | 公開(公告)日: | 2022-06-21 |
| 發明(設計)人: | 郭延祥;王灣灣;姚明 | 申請(專利權)人: | 中誠信征信有限公司 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62 |
| 代理公司: | 北京柏杉松知識產權代理事務所(普通合伙) 11413 | 代理人: | 項京;高鶯然 |
| 地址: | 100011 北京*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 目標 類型 用戶 識別 方法 裝置 電子設備 存儲 介質 | ||
本發明實施例提供了一種目標類型用戶的識別方法、裝置、電子設備及存儲介質,方法包括:將待識別用戶的用戶行為特征和第一變量值輸入到預先訓練好的用戶識別模型中;用戶識別模型為:預先用實驗組訓練樣本的用戶行為特征和第一變量值,及對照組訓練樣本的用戶行為特征和第二變量值訓練好的凈提升模型Uplift Model;獲取模型輸出的第一預測概率;將待識別用戶的用戶行為特征和第二變量值輸入到用戶識別模型中,獲取模型輸出的第二預測概率;判斷第一預測概率與第二預測概率的差值是否大于預設的閾值;如果是,則確定待識別用戶為目標類型用戶。可見,應用本發明實施例,可以識別出目標類型用戶,采集的樣本較全面,對目標類型用戶的識別較準確。
技術領域
本發明涉及信息處理的技術領域,特別是涉及一種目標類型用戶的識別方法、裝置、電子設備及存儲介質。
背景技術
目前,很多行業領域都采用大數據處理對商品信息、業務信息及用戶信息的不同類型的數據進行處理。
其中,從海量的用戶信息數據中,識別出某目標類型的用戶是對用戶信息進行處理中的一個重要內容。
相關技術中,可以先從大量的用戶信息中,獲取待識別用戶的用戶行為數據,從待識別用戶的用戶行為數據中提取用戶行為特征,將待識別用戶的用戶行為特征輸入到按目標類型預設的二分類模型中,判斷出該待識別用戶是否是目標類型用戶。但是,由于在訓練二分類模型時所采集的樣本是無規律的,導致采集的樣本不夠全面。因此相關技術中對目標類型用戶的識別不夠準確。
發明內容
本發明實施例的目的在于提供一種目標類型用戶的識別方法、裝置、電子設備及存儲介質,以較準確的識別出目標類型用戶。具體技術方案如下:
第一方面,本發明提供一種目標類型用戶的識別方法,所述方法包括:
獲得待識別用戶的用戶行為數據;
從所述用戶行為數據中,提取所述待識別用戶的用戶行為特征;
將所述待識別用戶的用戶行為特征和第一變量值輸入到預先訓練好的用戶識別模型中;所述用戶識別模型為:針對目標類型用戶對應的目標行為,預先用實驗組訓練樣本的用戶行為特征和第一變量值,及對照組訓練樣本的用戶行為特征和第二變量值訓練好的凈提升模型Uplift Model;所述實驗組訓練樣本的用戶行為特征和對照組訓練樣本的用戶行為特征分別為從實驗組訓練樣本的用戶行為數據和對照組訓練樣本的用戶行為數據中提取的;所述實驗組訓練樣本的用戶行為數據為:滿足預設條件的情況下,用戶執行目標行為的正樣本數據或不執行目標行為的負樣本數據;所述對照組訓練樣本的用戶行為數據為:不滿足預設條件的情況下,用戶執行目標行為的正樣本數據或不執行目標行為的負樣本數據;
獲取用戶識別模型輸出的用戶執行所述目標行為的第一預測概率;
將所述待識別用戶的用戶行為特征和第二變量值輸入到所述用戶識別模型中;
獲取用戶識別模型輸出的用戶執行所述目標行為的第二預測概率;
計算所述第一預測概率與所述第二預測概率的差值作為在只有滿足預設條件的情況下,用戶執行所述目標行為的條件預測概率;
判斷所述條件預測概率是否大于預設的閾值;
如果是,則確定所述待識別用戶為目標類型用戶。
可選的,所述用戶識別模型的訓練過程包括:
將實驗組樣本的用戶行為數據標記為實驗組,將對照組樣本的用戶行為數據標記為對照組;
將實驗組樣本的用戶行為數據和對照組樣本的用戶行為數據合并為數據集;
按預設比例抽取數據集中的樣本,構成訓練樣本集;所述訓練樣本集中包含實驗組訓練樣本和對照組訓練樣本;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中誠信征信有限公司,未經中誠信征信有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910967496.2/2.html,轉載請聲明來源鉆瓜專利網。





