[發(fā)明專利]一種作弊檢測方法及裝置在審
| 申請?zhí)枺?/td> | 201510846125.0 | 申請日: | 2015-11-27 |
| 公開(公告)號: | CN106815452A | 公開(公告)日: | 2017-06-09 |
| 發(fā)明(設(shè)計(jì))人: | 孫鵬飛;李春生;金陽春 | 申請(專利權(quán))人: | 蘇寧云商集團(tuán)股份有限公司 |
| 主分類號: | G06F19/00 | 分類號: | G06F19/00 |
| 代理公司: | 江蘇圣典律師事務(wù)所32237 | 代理人: | 許峰,蘇一幟 |
| 地址: | 210042 江蘇省*** | 國省代碼: | 江蘇;32 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 作弊 檢測 方法 裝置 | ||
技術(shù)領(lǐng)域
本發(fā)明涉及電子商務(wù)技術(shù)領(lǐng)域,尤其涉及一種作弊檢測方法及裝置。
背景技術(shù)
隨著電子商務(wù)技術(shù)的發(fā)展,在線購物平臺已成為消費(fèi)者在日常生活不可或缺的工具,在線購物平臺也為商家提供了一種快捷方便并且成本低廉的銷售渠道。而搜索引擎作為消費(fèi)者檢索商品的主要工具,如何在在線購物平臺的搜索引擎上提高商品的曝光機(jī)會,是各大購物網(wǎng)站和商家最為關(guān)心的事情。
商家為了獲得更高的訪問量,進(jìn)而獲得更高的經(jīng)濟(jì)效益,總是希望將自己店鋪的商品排在搜索結(jié)果靠前的位置。目前已經(jīng)出現(xiàn)不少商家針對搜索引擎的特點(diǎn),采取欺騙手段提高商品在搜索引擎中的排名,比如:雇傭水軍進(jìn)行商品評論,通過虛假訂單提高店鋪的交易量等等,即所謂的作弊行為。
為了防止商家的作弊行為,很多在線購物平臺采用人工審核的方式確定店鋪中的商品是否是作弊商品。但是由于工資水平的提高,以及商品的種類、數(shù)量的暴增,人工審核的成本很高。并且審查作弊商品已經(jīng)需要占用很多人工成本,對于實(shí)行作弊的用戶或是商品的審查,往往處于缺失狀態(tài),基本都是通過其他用戶舉報的方式進(jìn)行被動處理。
發(fā)明內(nèi)容
本發(fā)明的實(shí)施例提供一種作弊檢測方法及裝置,能夠降低審核的成本,并進(jìn)一步提高自動審查的深度。
為達(dá)到上述目的,本發(fā)明的實(shí)施例采用如下技術(shù)方案:
第一方面,本發(fā)明的實(shí)施例提供一種作弊檢測方法,包括:對樣本數(shù)據(jù)進(jìn) 行統(tǒng)計(jì),得到各個樣本的指標(biāo)參數(shù),其中,一個樣本的指標(biāo)參數(shù)的維度包括:所述一個樣本的總點(diǎn)擊量、點(diǎn)擊人數(shù)、每小時點(diǎn)擊量、樣本點(diǎn)擊地區(qū)和樣本對應(yīng)搜索詞的點(diǎn)擊量;
根據(jù)所述指標(biāo)參數(shù),生成各個樣本的特征參數(shù),其中,一個樣本的特征參數(shù)的維度包括:點(diǎn)擊量離散系數(shù)、每小時點(diǎn)擊量離散系數(shù)、地域集中度、查詢詞多樣性指數(shù)和人均點(diǎn)擊量;
根據(jù)所述各個樣本的特征參數(shù)建立檢測模型,并根據(jù)所述檢測模型判定待測試的商品數(shù)據(jù)是否異常,所述檢測模型的維度包括所述各個樣本的特征參數(shù)的維度。
結(jié)合第一方面,在第一方面的第一種可能的實(shí)現(xiàn)方式中,所述根據(jù)所述指標(biāo)參數(shù),生成各個樣本的特征參數(shù),包括:
對于一個樣本:
根據(jù)C=Stdev/Mean獲取所述一個樣本的總點(diǎn)擊量離散系數(shù),其中,Stdev表示所述一個樣本的總點(diǎn)擊量的標(biāo)準(zhǔn)差,Mean表示所述一個樣本的總點(diǎn)擊量的平均數(shù),C表示所述一個樣本的總點(diǎn)擊量離散系數(shù);
根據(jù)C’=Stdev’/Mean’獲取所述一個樣本的指定時段內(nèi)的點(diǎn)擊量離散系數(shù),其中,Stdev’表示所述一個樣本的在指定時段內(nèi)的點(diǎn)擊量的標(biāo)準(zhǔn)差,Mean’表示所述一個樣本的在指定時段內(nèi)的平均數(shù),C’表示所述一個樣本的在指定時段內(nèi)的離散系數(shù);
根據(jù)R=max(ni)/N獲取所述一個樣本的地域集中度,其中,ni表示所述一個樣本的樣本點(diǎn)擊地區(qū)中的單個城市的點(diǎn)擊量,N表示所述一個樣本的樣本點(diǎn)擊地區(qū)中的總點(diǎn)擊量,R表示所述一個樣本的地域集中度;
根據(jù)H=-∑(Pi)(lnPi)獲取所述一個樣本的查詢詞多樣性指數(shù),其中,H表示 多樣性指數(shù),Pi表示在所述一個樣本的樣本對應(yīng)搜索詞的點(diǎn)擊量中第i個查詢詞對應(yīng)的點(diǎn)擊量所占比例,當(dāng)總點(diǎn)擊量為N時,第i個查詢詞對應(yīng)的點(diǎn)擊量為ni,則Pi=ni/N;
根據(jù)P=N/U獲取所述一個樣本的人均點(diǎn)擊量,其中,N表示所述一個樣本的總點(diǎn)擊量,U表示所述一個樣本的點(diǎn)擊人數(shù),P表示人均點(diǎn)擊量;
重復(fù)上述對于所述一個樣本的過程,得到各個樣本的特征參數(shù)。
結(jié)合第一方面的第一種可能的實(shí)現(xiàn)方式,在第二種可能的實(shí)現(xiàn)方式中,所述根據(jù)所述各個樣本的特征參數(shù)建立檢測模型,包括:
建立基礎(chǔ)模型(X,Y),其中,X=(x1,x2,x3,x4,x5),Y=(1,0),x1表示點(diǎn)擊量離散系數(shù),x2表示指定時段內(nèi)的點(diǎn)擊量離散系數(shù),x3表示地域集中度,x4表示查詢詞多樣性指數(shù),x5表示人均點(diǎn)擊量,Y=1表示數(shù)據(jù)異常,Y=0表示數(shù)據(jù)正常
根據(jù)所述各個樣本的特征參數(shù)訓(xùn)練所述基礎(chǔ)模型,得到所述檢測模型。
結(jié)合第一方面,在第一方面的第三種可能的實(shí)現(xiàn)方式中,還包括:
當(dāng)待測試的商品數(shù)據(jù)異常時,提取目標(biāo)用戶的信息,所述目標(biāo)用戶包括點(diǎn)擊了出現(xiàn)異常的商品數(shù)據(jù)的用戶;
提取目標(biāo)用戶針對所述出現(xiàn)異常的商品數(shù)據(jù)的點(diǎn)擊數(shù);
根據(jù)所述目標(biāo)用戶針對所述出現(xiàn)異常的商品數(shù)據(jù)的點(diǎn)擊數(shù),檢測作弊用戶的點(diǎn)擊數(shù);
在所述出現(xiàn)異常的商品數(shù)據(jù)中,去除所述作弊用戶的點(diǎn)擊數(shù)。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于蘇寧云商集團(tuán)股份有限公司,未經(jīng)蘇寧云商集團(tuán)股份有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201510846125.0/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06F 電數(shù)字?jǐn)?shù)據(jù)處理
G06F19-00 專門適用于特定應(yīng)用的數(shù)字計(jì)算或數(shù)據(jù)處理的設(shè)備或方法
G06F19-10 .生物信息學(xué),即計(jì)算分子生物學(xué)中的遺傳或蛋白質(zhì)相關(guān)的數(shù)據(jù)處理方法或系統(tǒng)
G06F19-12 ..用于系統(tǒng)生物學(xué)的建模或仿真,例如:概率模型或動態(tài)模型,遺傳基因管理網(wǎng)絡(luò),蛋白質(zhì)交互作用網(wǎng)絡(luò)或新陳代謝作用網(wǎng)絡(luò)
G06F19-14 ..用于發(fā)展或進(jìn)化的,例如:進(jìn)化的保存區(qū)域決定或進(jìn)化樹結(jié)構(gòu)
G06F19-16 ..用于分子結(jié)構(gòu)的,例如:結(jié)構(gòu)排序,結(jié)構(gòu)或功能關(guān)系,蛋白質(zhì)折疊,結(jié)構(gòu)域拓?fù)洌媒Y(jié)構(gòu)數(shù)據(jù)的藥靶,涉及二維或三維結(jié)構(gòu)的
G06F19-18 ..用于功能性基因組學(xué)或蛋白質(zhì)組學(xué)的,例如:基因型–表型關(guān)聯(lián),不均衡連接,種群遺傳學(xué),結(jié)合位置鑒定,變異發(fā)生,基因型或染色體組的注釋,蛋白質(zhì)相互作用或蛋白質(zhì)核酸的相互作用





