[發明專利]識別模型訓練方法及裝置、用戶異常行為識別方法及裝置在審
| 申請號: | 202011070544.7 | 申請日: | 2020-10-09 |
| 公開(公告)號: | CN114417944A | 公開(公告)日: | 2022-04-29 |
| 發明(設計)人: | 樊鵬 | 申請(專利權)人: | 騰訊科技(深圳)有限公司 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62;G06N20/20;G06N3/04;G06N3/08 |
| 代理公司: | 中國專利代理(香港)有限公司 72001 | 代理人: | 李嘯;姜冰 |
| 地址: | 518057 廣東省深圳*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 識別 模型 訓練 方法 裝置 用戶 異常 行為 | ||
1.一種用于訓練識別模型的方法,所述識別模型用于識別用戶異常行為,其特征在于,所述方法包括:
接收至少兩個用戶的至少兩個用戶數據,所述至少兩個用戶數據包括與用戶異常行為有關的數據;
從所述至少兩個用戶數據提取至少兩個用戶特征;
執行將所述至少兩個用戶特征中的第一用戶特征進行加權,或將所述至少兩個用戶特征中的第二用戶特征與所述至少兩個用戶特征中的第三用戶特征進行關聯中的至少一個;
對經加權或關聯中的至少一個的所述至少兩個用戶特征進行組合;以及
對經組合的所述至少兩個用戶特征進行深度學習。
2.如權利要求1所述的方法,其特征在于,所述至少兩個用戶數據是應用的至少兩個用戶的用戶數據,并且從所述至少兩個用戶數據提取至少兩個用戶特征具體包括:
從所述至少兩個用戶數據中的、與所述應用的第一用戶的用戶屬性有關的數據,提取一個或多個用戶屬性特征;
從所述至少兩個用戶數據中的、與所述第一用戶的訪問所述應用的行為有關的數據,提取一個或多個用戶業務行為特征;
從所述至少兩個用戶數據中的、與所述第一用戶的除訪問所述應用以外的行為有關的數據,提取一個或多個用戶非業務行為特征;以及
對所提取的所述一個或多個用戶屬性特征、所述一個或多個用戶業務行為特征以及所述一個或多個用戶非業務行為特征進行特征處理,以增加特征密度,
所提取的特征包括嵌入特征和非嵌入特征。
3.如權利要求2所述的方法,其特征在于,所述方法進一步包括:
從所述至少兩個用戶特征生成用于訓練所述識別模型的至少兩個樣本,具體包括:
將所述第一用戶的所述一個或多個用戶屬性特征進行拼接;
將所述第一用戶的所述一個或多個用戶業務行為特征進行拼接;
將所述第一用戶的所述一個或多個用戶非業務行為特征進行拼接;
將經拼接的用戶屬性特征、經拼接的用戶業務行為特征、經拼接的用戶非業務行為特征進行拼接,以形成所述第一用戶的樣本數據。
4.如權利要求1所述的方法,其特征在于,將所述至少兩個用戶特征中的第一用戶特征進行加權具體包括:
使用池化操作對所述至少兩個用戶特征中的用戶特征集合進行壓縮,以得到用于所述用戶特征集合的統計向量;
基于所述統計向量,通過機器學習來獲得用于所述用戶特征集合的權重向量;
基于所述權重向量來對所述用戶特征集合中的至少所述第一用戶特征進行加權,所述加權包括:將所述用戶特征集合與所述權重向量相乘。
5.如權利要求1所述的方法,其特征在于,將所述第二用戶特征與所述第三用戶特征進行關聯具體包括:
使用雙線性操作來將所述第二用戶特征與所述第三用戶特征進行關聯,所述雙線性操作包括彼此不同的第一線性操作和第二線性操作,所述第一線性操作是內積計算,所述第二線性操作是哈達瑪積計算,
使用雙線性操作來將所述第二用戶特征與所述第三用戶特征進行關聯具體包括:
通過所述第一線性操作來計算所述第二用戶特征與交叉矩陣的內積;以及
通過所述第二線性函數來計算所述內積與所述第三用戶特征的哈達瑪積。
6.如權利要求1-5中的任一項所述的方法,其特征在于,所述方法具體包括:
基于一個或多個評估指標,對經訓練的所述識別模型進行在線評估和/或離線評估;以及
基于評估結果調整所述識別模型的參數,
所述調整具體包括:基于所述在線評估的結果和/或所述離線評估的結果調整所述識別模型的參數,直到所述在線評估的結果和/或所述離線評估的結果處于預設數值范圍。
7.如權利要求1-5中的任一項所述的方法,其特征在于,所述方法具體包括:
接收來自至少兩個用戶的至少兩個反饋;以及
基于所述至少兩個反饋調整所述識別模型的參數,
所述至少兩個反饋包括用戶投訴和用戶不活躍。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于騰訊科技(深圳)有限公司,未經騰訊科技(深圳)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011070544.7/1.html,轉載請聲明來源鉆瓜專利網。





