[發明專利]用戶信息獲取方法、裝置、電子設備及存儲介質有效
| 申請號: | 202010172307.5 | 申請日: | 2020-03-12 |
| 公開(公告)號: | CN111401433B | 公開(公告)日: | 2023-10-17 |
| 發明(設計)人: | 林岳;劉洪;張潔 | 申請(專利權)人: | 騰訊科技(深圳)有限公司 |
| 主分類號: | G06F18/2415 | 分類號: | G06F18/2415;G06F18/25;G06N3/0442;G06N3/047;G06N3/08;G06F17/18 |
| 代理公司: | 北京三高永信知識產權代理有限責任公司 11138 | 代理人: | 祝亞男 |
| 地址: | 518057 廣東省深圳*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 用戶信息 獲取 方法 裝置 電子設備 存儲 介質 | ||
1.一種用戶信息獲取方法,其特征在于,所述方法包括:
獲取用戶的個人特征、用戶活躍度的時間序列以及所述時間序列的統計特征,所述時間序列用于表示用戶活躍度在統計周期內的變化規律,所述統計特征用于表示所述時間序列在統計學上的數據特征;
將所述個人特征、所述時間序列以及所述統計特征輸入信息獲取模型,通過所述信息獲取模型預測所述用戶屬于不同活躍標簽的預測概率,所述活躍標簽用于表示所述用戶在用戶活躍周期中所處的階段;
將預測概率符合目標條件的活躍標簽確定為所述用戶的活躍信息。
2.根據權利要求1所述的方法,其特征在于,所述信息獲取模型為長短期記憶網絡LSTM模型;
所述將所述個人特征、所述時間序列以及所述統計特征輸入信息獲取模型,通過所述信息獲取模型預測所述用戶屬于不同活躍標簽的預測概率包括:
將所述個人特征、所述時間序列以及所述統計特征輸入LSTM模型中的至少一個記憶單元,通過所述至少一個記憶單元對所述個人特征、所述時間序列以及所述統計特征進行加權變換,得到所述用戶的特征向量,所述特征向量的維度等于活躍標簽的數量;
對所述特征向量進行指數歸一化處理,得到所述用戶屬于不同活躍標簽的預測概率。
3.根據權利要求1所述的方法,其特征在于,獲取用戶活躍度的時間序列包括:
抽樣采集所述用戶在統計周期內多個統計單位中的活躍度數據;
基于所述多個統計單位中的活躍度數據生成初始序列;
對所述初始序列進行平滑處理,得到所述時間序列。
4.根據權利要求3所述的方法,其特征在于,所述活躍度數據包括在線時長、活躍次數或者活躍天數中至少一項;
所述基于所述多個統計單位中的活躍度數據生成初始序列包括:
對任一個統計單位,對所述統計單位中的在線時長、活躍次數或者活躍天數中至少一項進行加權以及歸一化處理,得到所述用戶在所述統計單位內的活躍度指標;
按照所述用戶在不同統計單位內的活躍度指標,構建所述初始序列,所述初始序列中一個元素用于表示所述用戶在一個統計單位內的活躍度指標。
5.根據權利要求3所述的方法,其特征在于,平滑處理的方式包括差值平均、移動平均或者指數平均中至少一項。
6.根據權利要求1所述的方法,其特征在于,所述統計特征包括所述時間序列的均值、方差、極大值、極小值、增長率、下降率、波動率或者周期性中至少一項。
7.根據權利要求1所述的方法,其特征在于,所述信息獲取模型的訓練過程包括:
獲取樣本用戶的樣本個人特征、樣本時間序列、所述樣本時間序列的樣本統計特征以及所述樣本用戶的參考標簽;
基于所述樣本個人特征、所述樣本時間序列、所述樣本統計特征以及所述參考標簽,對初始獲取模型進行訓練,得到所述信息獲取模型。
8.一種用戶信息獲取裝置,其特征在于,所述裝置包括:
獲取模塊,用于獲取用戶的個人特征、用戶活躍度的時間序列以及所述時間序列的統計特征,所述時間序列用于表示用戶活躍度在統計周期內的變化規律,所述統計特征用于表示所述時間序列在統計學上的數據特征;
預測模塊,用于將所述個人特征、所述時間序列以及所述統計特征輸入信息獲取模型,通過所述信息獲取模型預測所述用戶屬于不同活躍標簽的預測概率,所述活躍標簽用于表示所述用戶在用戶活躍周期中所處的階段;
確定模塊,用于將預測概率符合目標條件的活躍標簽確定為所述用戶的活躍信息。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于騰訊科技(深圳)有限公司,未經騰訊科技(深圳)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010172307.5/1.html,轉載請聲明來源鉆瓜專利網。





