[發明專利]用戶識別方法和裝置、計算機可讀存儲介質、電子設備有效
| 申請號: | 202010929369.6 | 申請日: | 2020-09-07 |
| 公開(公告)號: | CN112036955B | 公開(公告)日: | 2021-09-24 |
| 發明(設計)人: | 劉洋;李嘉晨 | 申請(專利權)人: | 貝殼找房(北京)科技有限公司 |
| 主分類號: | G06Q30/02 | 分類號: | G06Q30/02;G06Q50/16;G06K9/62 |
| 代理公司: | 北京思源智匯知識產權代理有限公司 11657 | 代理人: | 王曉多 |
| 地址: | 100085 北京市海淀區*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 用戶 識別 方法 裝置 計算機 可讀 存儲 介質 電子設備 | ||
本公開實施例公開了一種用戶識別方法和裝置、計算機可讀存儲介質、電子設備,其中,方法包括:獲取待識別用戶的至少一種行為數據;根據所述至少一種行為數據確定所述待識別用戶的行為特征向量;利用判別器對所述行為特征向量進行判別,確定所述待識別用戶對應的預測概率;其中,所述判別器基于結合生成器的對抗訓練獲得;本實施例獲得待識別用戶的至少一種行為數據,提高了行為特征向量對待識別用戶的特征表達的準確性,并且,利用訓練好的判別器確定待識別用戶的預測概率,不需要反復訓練模型分類器,降低了復雜度,提高了識別效率。
技術領域
本公開涉及用戶識別技術領域,尤其是一種用戶識別方法和裝置、計算機可讀存儲介質、電子設備。
背景技術
人力成本是企業經營成本的重要組成部分,隨著人力成本的不斷提升,如何提升人效,成為了各大企業面臨的一大難題,如何對用戶進行識別,將異常用戶篩選出來,從而將更多精力集中在正常用戶,提高人效是現有技術需要解決的問題。例如,在房產服務領域,經紀人角色的時間分配上,在傳統的房產中介場景中,獲客這一環節會占據絕大比例。在獲客過程中,因為貝殼是強大的線上平臺,線上客源的重要性不言而喻,但客源的質量參差不齊,部分異常客戶,如推銷、微商、同業經紀人等,通過建立大量鏈接,占用經紀人的大量資源。經紀人在前期無法識別客戶是否異常,導致浪費大量人力成本。
發明內容
為了解決上述技術問題,提出了本公開。本公開的實施例提供了一種用戶識別方法和裝置、計算機可讀存儲介質、電子設備。
根據本公開實施例的一個方面,提供了一種用戶識別方法,包括:
獲取設定時間段內待識別用戶的至少一種行為數據;
根據所述至少一種行為數據確定所述待識別用戶的行為特征向量;
利用判別器對所述行為特征向量進行判別,確定所述待識別用戶對應的行為指標的預測概率;其中,所述判別器基于結合生成器的對抗訓練獲得。
可選地,所述至少一種行為數據包括以下至少之一:線上行為數據、線下行為數據、交互行為數據。
可選地,所述利用判別器對所述行為特征向量進行判別,確定所述待識別用戶對應的行為指標的預測概率之前,還包括:
基于所述生成器和所述判別器構成對抗網絡,對所述對抗網絡進行訓練。
可選地,所述對所述對抗網絡進行訓練,包括:
獲取第一正樣本集和真負樣本集;其中,所述第一正樣本集中包括至少一個正樣本,所述真負樣本集中包括至少一個真負樣本,每個所述真負樣本的行為數據與所述正樣本的行為數據之間的差異小于設定值;
將所述第一正樣本集輸入所述判別器,得到每個所述正樣本對應的行為指標的第一預估異常概率;
將所述真負樣本集中的每個真負樣本輸入到所述生成器,得到包括的至少一個第二樣本的第二正樣本集,并基于所述判別器確定每個所述第二樣本對應的行為指標的第二預估異常概率;
基于所述第一預估異常概率和所述第二預估異常概率,確定所述對抗網絡的損失;
基于所述損失對所述對抗網絡進行訓練,得到訓練后的判別器。
可選地,在基于所述第一預估異常概率和所述第二預估異常概率,確定所述對抗網絡的損失之前,還包括:
基于用戶生命價值網絡確定所述第一正樣本集和所述第二正樣本集中每個樣本對應的正常預估概率;
所述基于所述第一預估異常概率和所述第二預估異常概率,確定所述對抗網絡的損失,包括:
基于所述第一預估異常概率、所述第二預估異常概率和所述正常預估概率,確定所述對抗網絡的損失。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于貝殼找房(北京)科技有限公司,未經貝殼找房(北京)科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010929369.6/2.html,轉載請聲明來源鉆瓜專利網。





