[發明專利]基于網站注冊的用戶畫像生成方法、裝置、設備和介質在審
| 申請號: | 202011473435.X | 申請日: | 2020-12-15 |
| 公開(公告)號: | CN112417315A | 公開(公告)日: | 2021-02-26 |
| 發明(設計)人: | 王天宇 | 申請(專利權)人: | 深圳壹賬通智能科技有限公司 |
| 主分類號: | G06F16/9536 | 分類號: | G06F16/9536;G06F16/9535;G06F16/906;G06F16/958;G06F16/951 |
| 代理公司: | 廣州華進聯合專利商標代理有限公司 44224 | 代理人: | 吳平 |
| 地址: | 518052 廣東省深圳市前海深港合作區前*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 網站 注冊 用戶 畫像 生成 方法 裝置 設備 介質 | ||
本申請涉及大數據技術領域,尤其是一種基于網站注冊的用戶畫像生成方法、裝置、設備和介質。所述方法包括:獲取用戶對應的注冊網站列表,注冊網站列表是預先從預設網站的服務器爬取對應的包括注冊用戶標識以及注冊標志的注冊記錄,并根據用戶標識對注冊標志表征注冊的注冊記錄進行分類得到的;將所述網站注冊列表中的注冊網站與預設分類的標準網站的標識進行比較,以對所述注冊網站進行分類;統計每一分類中注冊網站的數量;根據每一分類中注冊網站的數量計算得到用戶畫像。采用本方法能夠提高用戶畫像的準確性。此外,本發明還涉及區塊鏈技術,用戶畫像以及注冊網站列表可存儲于區塊鏈節點中。
技術領域
本申請涉及大數據技術領域,特別是涉及一種基于網站注冊的用戶畫像生成方法、裝置、設備和介質。
背景技術
隨著大數據技術的發展,出現了各種各樣的場景,其中對于用戶進行畫像構建是一個比較重要的長江,對用戶進行畫像構建是通過對用戶進行打標簽、劃分客群、構建畫像,有助于加深企業對用戶的理解,從而提供有針對性的服務和營銷,減輕企業的營銷成本,并提升實際業務上的質量和效率。
然而,目前的用戶畫像需要抽取用戶的屬性標簽(如學歷、性別等),傳統的用戶畫像方法根據某一平臺上的用戶的社交、使用習慣數據抽取用戶的屬性標簽,容易因數據單一、數據缺陷導致抽取用戶屬性標簽的準確率低。如何提升抽取用戶屬性標簽的準確率成為亟待解決的問題。
發明內容
基于此,有必要針對上述技術問題,提供一種能夠提高準確性的基于網站注冊的用戶畫像生成方法、裝置、設備和介質。
一種基于網站注冊的用戶畫像生成方法,所述方法包括:
獲取用戶對應的注冊網站列表,所述注冊網站列表是預先從預設網站的服務器爬取對應的包括注冊用戶標識以及注冊標志的注冊記錄,并根據所述用戶標識對注冊標志表征注冊的注冊記錄進行分類得到的;
將所述網站注冊列表中的注冊網站與預設分類的標準網站的標識進行比較,以對所述注冊網站進行分類;
統計每一分類中注冊網站的數量;
根據每一分類中注冊網站的數量計算得到用戶畫像。
在其中一個實施例中,所述根據每一分類中注冊網站的數量計算得到用戶畫像,包括:
獲取預設的多個場景、各個場景對應的多個標簽以及多個標簽對應的閾值;
獲取所述多個場景各自對應的當前注冊網站類型;
從所統計的每一分類中的注冊網站的數量中,選取與所述當前注冊網站類型對應的當前注冊數量;
將所述當前注冊數量與所述閾值進行比較得到標簽;
將所得到的標簽進行組合得到用戶畫像。
在其中一個實施例中,所述根據每一分類中注冊網站的數量計算得到用戶畫像,包括:
獲取當前場景,以及所述當前場景對應的當前注冊網站類型;
從所統計的每一分類中的注冊網站的數量中,選取與所述當前注冊網站類型對應的當前注冊數量;
根據所述當前注冊數量進行模型訓練得到用戶畫像模型,根據所述用戶畫像模型得到用戶畫像。
在其中一個實施例中,所述根據所述當前注冊數量進行模型訓練得到用戶畫像模型,包括:
根據所述當前注冊數量生成第一預設維度的第一特征向量;
獲取根據用戶基本信息生成的第二預設維度的第二特征向量;
根據所述第一特征向量和所述第二特征向量生成用戶畫像模型;
所述根據所述用戶畫像模型得到用戶畫像,包括:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于深圳壹賬通智能科技有限公司,未經深圳壹賬通智能科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011473435.X/2.html,轉載請聲明來源鉆瓜專利網。





