[發明專利]風險行為識別方法、存儲介質、設備及系統有效
| 申請號: | 201810024348.2 | 申請日: | 2018-01-10 |
| 公開(公告)號: | CN108243191B | 公開(公告)日: | 2019-08-23 |
| 發明(設計)人: | 王璐;張文明;陳少杰 | 申請(專利權)人: | 武漢斗魚網絡科技有限公司 |
| 主分類號: | H04L29/06 | 分類號: | H04L29/06 |
| 代理公司: | 武漢智權專利代理事務所(特殊普通合伙) 42225 | 代理人: | 王維 |
| 地址: | 430000 湖北省武漢市東湖開*** | 國省代碼: | 湖北;42 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 用戶集合 轉移概率 風險行為 設備及系統 存儲介質 嫌疑用戶 信息熵 預設 大小判斷 惡意用戶 行為日志 行為序列 大數據 風控 作弊 抽取 發現 | ||
本發明公開了一種風險行為識別方法、存儲介質、設備及系統,涉及大數據風控領域,該方法包括以下步驟:根據行為日志數據,抽取設定用戶集合內每個用戶的各個特定行為,并得到每個用戶的特定行為序列。利用預設的強規則找出設定用戶集合內高風險的嫌疑用戶,將其記為第一用戶集合,并將設定用戶集合剩余的用戶記為第二用戶集合。設定特定行為對,計算第一轉移概率和第二轉移概率。對相同的特定行為對,判斷第一轉移概率和第二轉移概率的差值是否在預設范圍內,若否,則將該特定行為對記為風險特定行為對。計算每組風險特定行為對的信息熵,根據信息熵大小判斷用戶是否為嫌疑用戶。本發明中的風險行為識別方法能發現作弊特征不明顯的惡意用戶。
技術領域
本發明涉及大數據風控領域,具體涉及一種風險行為識別方法、存儲介質、設備及系統。
背景技術
在直播平臺上存在一些惡意用戶,這些用戶通常會做一些虛假刷關注或者刷人氣的行為,找到這種惡意用戶有利于維持直播平臺的秩序,保證平臺能長期健康發展。
對于這種惡意用戶的識別,通常的方法是采用強規則,即比如(1)一個賬號在多個設備上登錄;(2)用戶的行為日志異常,如用戶發了彈幕但是沒有點擊彈幕按鈕等。然而,強規則只能找出那些特征明顯的惡意用戶,對于其他特征不太明顯的用戶則無能為力。而且目前惡意用戶的作弊手段變得更加復雜化,通過偽裝惡意用戶的行為與正常用戶越來越相似,強規則識別效果不佳。
發明內容
針對現有技術中存在的缺陷,本發明的目的在于提供一種能發現作弊特征不明顯的惡意用戶的風險行為識別方法。
為達到以上目的,本發明采取的技術方案是:
一種風險行為識別方法,該方法包括以下步驟:
根據行為日志數據,抽取設定用戶集合內每個用戶的各個特定行為,并對每個用戶的所有特定行為在時間窗口內按時間排序得到每個用戶的特定行為序列;
利用預設的強規則找出設定用戶集合內高風險的嫌疑用戶,將其記為第一用戶集合,并將設定用戶集合剩余的用戶記為第二用戶集合;
根據特定行為序列設定特定行為對,計算第一用戶集合中每個用戶每組特定行為對的第一轉移概率,以及計算第二用戶集合中每個用戶每組特定行為對的第二轉移概率;
對于相同的特定行為對,判斷第一轉移概率和第二轉移概率的差值是否在預設范圍內,若否,則將該特定行為對記為風險特定行為對;以及
計算每組風險特定行為對的信息熵,根據信息熵大小判斷用戶是否為嫌疑用戶。
在上述技術方案的基礎上,每個用戶的特定行為序列記為其中Su是用戶u的特定行為序列,atu是用戶u的第t個特定行為,t=1,2,3...ku,并為每個特定行為一一對應賦予狀態值,狀態值記為cn,n=1,2,3...ku。
在上述技術方案的基礎上,
計算每個用戶每組特定行為對的第一轉移概率的步驟包括:
計算第一用戶集合S發生兩次連續的特定行為的次數Npq(S),其中第一個特定行為狀態值為cp而第二個特定行為狀態值為cq,p=1,2,3...ku,q=1,2,3...ku;
計算第一用戶集合S中狀態值為cp的特定行為發生的總次數Np(S);
根據公式計算第一個特定行為狀態值為cp而第二個特定行為狀態值為cq的第一轉移概率ppq(S);
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于武漢斗魚網絡科技有限公司,未經武漢斗魚網絡科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810024348.2/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種網絡標識的可信管理方法和系統
- 下一篇:應用訪問網絡的識別方法和系統





