[發明專利]一種作弊檢測方法及裝置在審
| 申請號: | 201510846125.0 | 申請日: | 2015-11-27 |
| 公開(公告)號: | CN106815452A | 公開(公告)日: | 2017-06-09 |
| 發明(設計)人: | 孫鵬飛;李春生;金陽春 | 申請(專利權)人: | 蘇寧云商集團股份有限公司 |
| 主分類號: | G06F19/00 | 分類號: | G06F19/00 |
| 代理公司: | 江蘇圣典律師事務所32237 | 代理人: | 許峰,蘇一幟 |
| 地址: | 210042 江蘇省*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 作弊 檢測 方法 裝置 | ||
1.一種作弊檢測方法,其特征在于,包括:
對樣本數據進行統計,得到各個樣本的指標參數,其中,一個樣本的指標參數的維度包括:所述一個樣本的總點擊量、點擊人數、每小時點擊量、樣本點擊地區和樣本對應搜索詞的點擊量;
根據所述指標參數,生成各個樣本的特征參數,其中,一個樣本的特征參數的維度包括:點擊量離散系數、每小時點擊量離散系數、地域集中度、查詢詞多樣性指數和人均點擊量;
根據所述各個樣本的特征參數建立檢測模型,并根據所述檢測模型判定待測試的商品數據是否異常,所述檢測模型的維度包括所述各個樣本的特征參數的維度。
2.根據權利要求1所述的方法,其特征在于,所述根據所述指標參數,生成各個樣本的特征參數,包括:
對于一個樣本:
根據C=Stdev/Mean獲取所述一個樣本的總點擊量離散系數,其中,Stdev表示所述一個樣本的總點擊量的標準差,Mean表示所述一個樣本的總點擊量的平均數,C表示所述一個樣本的總點擊量離散系數;
根據C’=Stdev’/Mean’獲取所述一個樣本的指定時段內的點擊量離散系數,其中,Stdev’表示所述一個樣本的在指定時段內的點擊量的標準差,Mean’表示所述一個樣本的在指定時段內的平均數,C’表示所述一個樣本的在指定時段內的離散系數;
根據R=max(ni)/N獲取所述一個樣本的地域集中度,其中,ni表示所述一個樣本的樣本點擊地區中的單個城市的點擊量,N表示所述一個樣本的樣本點擊地區中的總點擊量,R表示所述一個樣本的地域集中度;
根據H=-∑(Pi)(lnPi)獲取所述一個樣本的查詢詞多樣性指數,其中,H表示多樣性指數,Pi表示在所述一個樣本的樣本對應搜索詞的點擊量中第i個查詢詞對應的點擊量所占比例,當總點擊量為N時,第i個查詢詞對應的點擊量為ni,則Pi=ni/N;
根據P=N/U獲取所述一個樣本的人均點擊量,其中,N表示所述一個樣本的總點擊量,U表示所述一個樣本的點擊人數,P表示人均點擊量;
重復上述對于所述一個樣本的過程,得到各個樣本的特征參數。
3.根據權利要求2所述的方法,其特征在于,所述根據所述各個樣本的特征參數建立檢測模型,包括:
建立基礎模型(X,Y),其中,X=(x1,x2,x3,x4,x5),Y=(1,0),x1表示點擊量離散系數,x2表示指定時段內的點擊量離散系數,x3表示地域集中度,x4表示查詢詞多樣性指數,x5表示人均點擊量,Y=1表示數據異常,Y=0表示數據正常
根據所述各個樣本的特征參數訓練所述基礎模型,得到所述檢測模型。
4.根據權利要求1所述的方法,其特征在于,還包括:
當待測試的商品數據異常時,提取目標用戶的信息,所述目標用戶包括點擊了出現異常的商品數據的用戶;
提取目標用戶針對所述出現異常的商品數據的點擊數;
根據所述目標用戶針對所述出現異常的商品數據的點擊數,檢測作弊用戶的點擊數;
在所述出現異常的商品數據中,去除所述作弊用戶的點擊數。
5.根據權利要求4所述的方法,其特征在于,還包括:所述檢測作弊用戶的點擊數處于異常范圍,所述異常范圍包括:點擊數處于大于μ+3σ和小于μ-3σ的用戶;或者,點擊數處于大于μ-2σ和小于μ+2σ的用戶,其中,μ表示正態分布的數學期望,σ表示正態分布的標準差。
6.一種作弊檢測裝置,其特征在于,包括:
統計模塊,用于對樣本數據進行統計,得到各個樣本的指標參數,其中,一個樣本的指標參數的維度包括:所述一個樣本的總點擊量、點擊人數、每小時點擊量、樣本點擊地區和樣本對應搜索詞的點擊量;
特征提取模塊,用于根據所述指標參數,生成各個樣本的特征參數,其中,一個樣本的特征參數的維度包括:點擊量離散系數、每小時點擊量離散系數、地域集中度、查詢詞多樣性指數和人均點擊量;
分析模塊,用于根據所述各個樣本的特征參數建立檢測模型,并根據所述檢測模型判定待測試的商品數據是否異常,所述檢測模型的維度包括所述各個樣本的特征參數的維度。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于蘇寧云商集團股份有限公司,未經蘇寧云商集團股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201510846125.0/1.html,轉載請聲明來源鉆瓜專利網。
- 同類專利
- 專利分類
G06F 電數字數據處理
G06F19-00 專門適用于特定應用的數字計算或數據處理的設備或方法
G06F19-10 .生物信息學,即計算分子生物學中的遺傳或蛋白質相關的數據處理方法或系統
G06F19-12 ..用于系統生物學的建模或仿真,例如:概率模型或動態模型,遺傳基因管理網絡,蛋白質交互作用網絡或新陳代謝作用網絡
G06F19-14 ..用于發展或進化的,例如:進化的保存區域決定或進化樹結構
G06F19-16 ..用于分子結構的,例如:結構排序,結構或功能關系,蛋白質折疊,結構域拓撲,用結構數據的藥靶,涉及二維或三維結構的
G06F19-18 ..用于功能性基因組學或蛋白質組學的,例如:基因型–表型關聯,不均衡連接,種群遺傳學,結合位置鑒定,變異發生,基因型或染色體組的注釋,蛋白質相互作用或蛋白質核酸的相互作用





