[發明專利]使用類別識別模型來確定用戶的類別標簽的方法和裝置有效
| 申請號: | 202010045891.8 | 申請日: | 2020-01-16 |
| 公開(公告)號: | CN111274907B | 公開(公告)日: | 2023-04-25 |
| 發明(設計)人: | 管楚;潘健民 | 申請(專利權)人: | 支付寶(中國)網絡技術有限公司 |
| 主分類號: | G06V40/20 | 分類號: | G06V40/20;G06V20/40;G06V10/764 |
| 代理公司: | 北京永新同創知識產權代理有限公司 11376 | 代理人: | 林錦輝;劉景峰 |
| 地址: | 200120 上海市浦東新*** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 使用 類別 識別 模型 確定 用戶 標簽 方法 裝置 | ||
本說明書實施例提供用于使用類別識別模型來確定用戶的類別標簽的方法和裝置。在該方法中,對用戶的動態行為數據進行向量化處理,以得到所述用戶的動態行為向量表示;將動態行為向量表示提供給邏輯分布抽取模型,以得到用戶的行為邏輯向量表示,所述行為邏輯向量表示反映所述用戶的行為邏輯分布;以及將行為邏輯向量表示提供給標簽分類模型,確定用戶的類別標簽。
技術領域
本說明書的實施例通常涉及計算機領域,更具體地,涉及使用類別識別模型來確定用戶的類別標簽的方法及裝置。
背景技術
在各種用戶類別識別場景(比如,類罪/風險類別識別場景)中,通常會創建一個類別識別模型,在該類別識別模型中,使用具體特征描述(例如,類罪/風險類別描述)來預先定義模型特征,并且每個類別被定義為與一個模型特征集對應。在進行用戶類別識別時,根據具體的特征描述進行相應的特征提取,然后將所提取的特征數據輸入到類別識別模型中,以確定用戶的類別標簽,由此對用戶進行類別識別,例如,識別用戶是否是類罪/風險用戶。
然而,類別的特征描述通常根據經驗人為確定,每個類別(例如,類罪/風險類別)的特征描述不一定非常準確。例如,傳銷和非法集資的特征描述很可能會存在交集,所以很難給出類別之間的界限。按照上述用戶類別識別方法,在多類別識別的情況下,非常可能會出現誤判。此外,例如,在類罪/風險類別識別的場景下,惡意用戶會不停變換其行為特征,以防止被類別識別模型檢測到。在這種情況下,上述類別識別方法通常無法跟隨惡意用戶的行為特征的變化而變化,由此導致類別識別效率不高。
發明內容
鑒于上述問題,本說明書的實施例提供一種使用類別識別模型來確定用戶的類別標簽的方法及裝置。在該方法中,基于用戶的動態行為數據來得到用戶的行為邏輯表示,并且基于用戶的行為邏輯表示來進行類別識別。考慮到行為邏輯分布與行為目的之間形成對應關系,每種類別用戶的行為目的通常是相同或者非常相似的,由此導致行為邏輯分布也會是相同或者非常近似(即使在用戶的行為特征被惡意變換的情況下),利用上述類別識別方法,由于基于用戶的動態行為數據而導出的行為邏輯表示可以反映用戶的行為邏輯分布,從而能夠基于用戶的行為目的來進行類別識別,由此可以提高用戶類別識別的準確性。這種方法尤其適用于類罪識別的應用場景。
根據本說明書實施例的一個方面,提供一種用于使用類別識別模型來確定用戶的類別標簽的方法,所述類別識別模型包括邏輯分布抽取模型和標簽分類模型,所述方法包括:對用戶的動態行為數據進行向量化處理,以得到所述用戶的動態行為向量表示;將所述動態行為向量表示提供給邏輯分布抽取模型,以得到所述用戶的行為邏輯向量表示,所述行為邏輯向量表示反映所述用戶的行為邏輯分布;以及將所述行為邏輯向量表示提供給標簽分類模型,確定所述用戶的類別標簽。
可選地,在上述方面的一個示例中,所述動態行為數據可以包括指定時段內的行為序列數據。
可選地,在上述方面的一個示例中,所述行為序列數據可以包括交易行為序列數據。
可選地,在上述方面的一個示例中,對用戶的動態行為數據進行向量化處理,以得到所述用戶的動態行為向量表示可以包括:對用戶的動態行為數據和靜態行為數據進行向量化處理,以得到所述用戶的動態行為向量表示和靜態行為向量表示;將所述行為邏輯向量表示提供給標簽分類模型,確定所述用戶的類別標簽可以包括:將所述行為邏輯向量表示和所述靜態行為向量表示提供給標簽分類模型,確定所述用戶的類別標簽。
可選地,在上述方面的一個示例中,將所述行為邏輯向量表示和所述靜態行為向量表示提供給標簽分類模型,確定所述用戶的類別標簽可以包括:將所述行為邏輯向量表示和所述靜態行為向量表示級聯后提供給標簽分類模型,確定所述用戶的類別標簽。
可選地,在上述方面的一個示例中,所述靜態行為數據可以包括歷史類別標簽數據、關系特征數據和用戶屬性數據中的至少一種。
可選地,在上述方面的一個示例中,所述類別標簽可以包括類罪標簽,所述用戶屬性數據還可以包括高頻高危地點數據和/或高頻行為發生時間數據。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于支付寶(中國)網絡技術有限公司,未經支付寶(中國)網絡技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010045891.8/2.html,轉載請聲明來源鉆瓜專利網。





