[發明專利]用戶識別方法及裝置有效
| 申請號: | 201710630751.5 | 申請日: | 2017-07-28 |
| 公開(公告)號: | CN107451247B | 公開(公告)日: | 2021-03-30 |
| 發明(設計)人: | 王琳 | 申請(專利權)人: | 北京小米移動軟件有限公司 |
| 主分類號: | G06F16/35 | 分類號: | G06F16/35;G06F16/9535;G06F16/9536 |
| 代理公司: | 北京英創嘉友知識產權代理事務所(普通合伙) 11447 | 代理人: | 曾堯 |
| 地址: | 100085 北京市海淀區清河*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 用戶 識別 方法 裝置 | ||
本公開是關于一種用戶識別方法及裝置。該方法包括:根據用戶的行為數據,確定該用戶的行為特征;判斷該行為特征是否滿足識別條件;在該行為特征滿足識別條件的情況下,識別該用戶為第一類別用戶。本公開的實施例通過分析用戶的行為,確定用戶的行為特征,并判斷該行為特征是否滿足識別條件,來識別該用戶是否為第一類別用戶。第一類別用戶的行為特征很難被規避,因此,通過分析用戶的行為特征對用戶進行識別,提高了用戶識別的準確率和召回率。
技術領域
本公開涉及計算機技術領域,尤其涉及一種用戶識別方法及裝置。
背景技術
隨著移動互聯網的快速發展,各式各樣的應用隨之產生,并為用戶提供多種多樣的交流方式。然而,隨之產生的垃圾廣告問題也日趨嚴重,不斷侵害用戶的合法利益。
相關技術是利用深度學習或者語言模型將用戶發送的文本信息進行分類,將發送的文本信息中包含垃圾廣告內容的用戶定義為垃圾廣告用戶。然而,垃圾廣告用戶通常將重點詞匯替換成諧音字甚至是特殊符號以規避識別,導致識別召回率較低。同時,存在將普通用戶錯當成垃圾廣告用戶的情況,使得識別準確率也較低。
發明內容
為克服相關技術中存在的問題,本公開提供一種用戶識別方法及裝置。
根據本公開實施例的第一方面,提供一種用戶識別方法,包括:
根據用戶的行為數據,確定所述用戶的行為特征;
判斷所述行為特征是否滿足識別條件;
在所述行為特征滿足識別條件的情況下,識別所述用戶為第一類別用戶。
對于以上方法,在一種可能的實現方式中,根據用戶的行為數據,確定所述用戶的行為特征,包括:
獲取所述用戶在第一時間區間內發送信息的群組的第一數量,將所述第一數量確定為所述行為特征,
判斷所述行為特征是否滿足識別條件,包括:
在所述第一數量大于或等于第一閾值的情況下,判斷所述行為特征滿足識別條件。
對于以上方法,在一種可能的實現方式中,根據用戶的行為數據,確定所述用戶的行為特征,包括:
獲取所述用戶在第二時間區間內發送信息的第二數量,將所述第二數量確定為所述行為特征,
判斷所述行為特征是否滿足識別條件,包括:
在所述第二數量大于或等于第二閾值的情況下,判斷所述行為特征滿足識別條件。
對于以上方法,在一種可能的實現方式中,根據用戶的行為數據,確定所述用戶的行為特征,包括:
獲取所述用戶在第三時間區間內發送信息的第三數量以及所述信息的第一內容;
基于所述第一內容,確定所述用戶在所述第三時間區間內發送的不同信息的第四數量;
確定所述第四數量與所述第三數量之間的第一比值,將所述第一比值確定為所述行為特征,
判斷所述行為特征是否滿足識別條件,包括:
在所述第一比值小于或等于第三閾值的情況下,判斷所述行為特征滿足識別條件。
對于以上方法,在一種可能的實現方式中,根據用戶的行為數據,確定所述用戶的行為特征,包括:
獲取所述用戶在第四時間區間內發送信息的群組的第五數量以及所述信息的第二內容;
基于所述第二內容,確定所述用戶在所述第四時間區間內發送的不同信息的第六數量;
確定所述第六數量與所述第五數量之間的第二比值,將所述第二比值確定為所述行為特征,
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京小米移動軟件有限公司,未經北京小米移動軟件有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710630751.5/2.html,轉載請聲明來源鉆瓜專利網。





