[發明專利]作弊用戶檢測方法、電子設備及計算機可讀存儲介質有效
| 申請號: | 201910290109.6 | 申請日: | 2019-04-11 |
| 公開(公告)號: | CN110009430B | 公開(公告)日: | 2023-08-11 |
| 發明(設計)人: | 溫蕊 | 申請(專利權)人: | 騰訊科技(深圳)有限公司 |
| 主分類號: | G06Q30/0282 | 分類號: | G06Q30/0282;G06Q30/018;G06F16/901;G06F40/289;G06N3/0464;G06N3/042 |
| 代理公司: | 北京市立方律師事務所 11330 | 代理人: | 張筱寧 |
| 地址: | 518000 廣東省深圳*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 作弊 用戶 檢測 方法 電子設備 計算機 可讀 存儲 介質 | ||
本申請實施例提供了一種作弊用戶檢測方法、電子設備及計算機可讀存儲介質,涉及機器學習領域。該方法包括:獲取預設時間內的評論日志,然后基于獲取的預設時間內的評論日志,確定各個用戶分別對應的用戶特征信息,然后基于各個用戶分別對應的用戶特征信息,構建圖結構文件,然后基于圖結構文件并通過圖卷積網絡模型,識別作弊用戶。本申請實施例可以檢測作弊用戶,并可以降低檢測作弊用戶的復雜度,提升檢測作弊用戶的精確度。
技術領域
本申請涉及機器學習技術領域,具體而言,本申請涉及一種作弊用戶檢測方法、電子設備及計算機可讀存儲介質。
背景技術
隨著信息技術的發展,眾包平臺也隨之發展,眾包作弊評論用戶也隨之產生,其中,眾包作弊評論用戶為在眾包平臺上自愿接受發表作弊評論任務的人。眾包作弊評論用戶在眾包平臺上發表對產品或者服務不符合實際的鼓吹評論或者誹謗評論等,嚴重影響正常用戶的觀點或者正常用戶的消費行為,因此檢測作弊用戶(例如眾包作弊評論用戶)成為一個關鍵問題。
發明人在實際研究過程中發現:在當前的某些場景中,大部分的眾包平臺發布的作弊任務大都集中在刷評論、刷點贊數以及刷下載量等方面,以提高刷量商品或者刷量服務在排行榜上的排名或者提高搜索熱度,以使得更多的用戶看到這類商品或者服務,但是由于這些作弊用戶在平時為行為正常的普通用戶,從而導致檢測作弊用戶的復雜度較高。
發明內容
本申請提供了一種作弊用戶檢測方法、電子設備及計算機可讀存儲介質,用于解決如何檢測作弊用戶以及作弊用戶檢測的復雜度較高的技術問題。技術方案如下:
第一方面,提供了一種作弊用戶檢測方法,該方法包括:
獲取預設時間內的評論日志;
基于獲取的預設時間內的評論日志,確定各個用戶分別對應的用戶特征信息;
基于各個用戶分別對應的用戶特征信息,構建圖結構文件;
基于圖結構文件并通過圖卷積網絡模型,識別作弊用戶。
在一種可能的實現方式中,基于獲取的預設時間內的評論日志,確定各個用戶分別對應的用戶特征信息,之前還包括:
基于獲取的預設時間內的評論日志,對評論日志中的內容執行預設操作;
預設操作包括以下至少一項:數據清洗操作、分詞操作、去停用詞操作以及提取關鍵詞操作;
基于獲取的預設時間內的評論日志,確定各個用戶分別對應的用戶特征信息,包括:
基于預設操作處理后的評論日志,確定各個用戶分別對應的用戶特征信息。
在一種可能的實現方式中,用戶特征信息包括以下至少一項:
用戶行為特征信息;用戶文本內容特征信息;
其中,基于評論日志,確定各個用戶分別對應的用戶文本內容特征信息,包括:
從評論日志中提取各個用戶分別對應的用戶文本內容;
基于各個用戶分別對應的用戶文本內容訓練Doc2Vec模型,并輸出各個用戶分別對應的用戶文本內容特征信息。
在一種可能的實現方式中,基于各個用戶分別對應的用戶特征信息,構建圖結構文件,包括:
將各個用戶分別對應的唯一標識信息確定為圖結構的節點;
基于各個用戶分別對應的用戶特征信息,并通過預設條件確定圖結構的邊關系;
基于圖結構的節點以及圖結構的邊關系,構建圖結構文件;
各個用戶分別對應的用戶特征信息作為各個節點分別對應的屬性信息。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于騰訊科技(深圳)有限公司,未經騰訊科技(深圳)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910290109.6/2.html,轉載請聲明來源鉆瓜專利網。





