[發(fā)明專利]互聯(lián)網(wǎng)廣告異常點(diǎn)擊檢測(cè)方法、裝置、設(shè)備及可讀存儲(chǔ)介質(zhì)有效
| 申請(qǐng)?zhí)枺?/td> | 201710402564.1 | 申請(qǐng)日: | 2017-06-01 |
| 公開(kāi)(公告)號(hào): | CN107168854B | 公開(kāi)(公告)日: | 2020-06-30 |
| 發(fā)明(設(shè)計(jì))人: | 秦筱樺;何敬江;畢野 | 申請(qǐng)(專利權(quán))人: | 北京京東尚科信息技術(shù)有限公司;北京京東世紀(jì)貿(mào)易有限公司 |
| 主分類號(hào): | G06F11/30 | 分類號(hào): | G06F11/30;G06F11/34;G06F16/958;G06Q30/02 |
| 代理公司: | 北京律智知識(shí)產(chǎn)權(quán)代理有限公司 11438 | 代理人: | 姜怡;闞梓瑄 |
| 地址: | 100195 北京市海淀區(qū)杏石口路6*** | 國(guó)省代碼: | 北京;11 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 互聯(lián)網(wǎng) 廣告 異常 點(diǎn)擊 檢測(cè) 方法 裝置 設(shè)備 可讀 存儲(chǔ) 介質(zhì) | ||
本申請(qǐng)公開(kāi)一種互聯(lián)網(wǎng)廣告異常點(diǎn)擊檢測(cè)方法、裝置、設(shè)備及可讀存儲(chǔ)介質(zhì)。該方法包括:從多條日志數(shù)據(jù)中分別篩選出廣告點(diǎn)擊量大于一預(yù)設(shè)的第一閾值的多個(gè)樣本數(shù)據(jù),樣本數(shù)據(jù)為基于不同維度聚合后的點(diǎn)擊量數(shù)據(jù);根據(jù)多個(gè)樣本數(shù)據(jù),基于配置化文件,分別確定相應(yīng)維度的各統(tǒng)計(jì)特征的特征值;建立各統(tǒng)計(jì)特征的特征值的第一高斯分布,并獲得各第一高斯分布的第一均值和第一標(biāo)準(zhǔn)差;以及根據(jù)各統(tǒng)計(jì)特征的特征值的第一高斯分布的第一均值和第一標(biāo)準(zhǔn)差,分別判斷多個(gè)樣本數(shù)據(jù)是否異常;其中,配置化文件包括用于確定各統(tǒng)計(jì)特征的特征值的計(jì)算算子。該方法能夠有效實(shí)現(xiàn)異常點(diǎn)擊的自動(dòng)檢測(cè)。
技術(shù)領(lǐng)域
本發(fā)明涉及互聯(lián)網(wǎng)技術(shù)領(lǐng)域,具體而言,涉及一種互聯(lián)網(wǎng)廣告異常點(diǎn)擊檢測(cè)方法、裝置、設(shè)備及可讀存儲(chǔ)介質(zhì)。
背景技術(shù)
CPC廣告是目前互聯(lián)網(wǎng)中最為常見(jiàn)的一種廣告形式,其為Cost per Click的英文縮寫(xiě),即每次點(diǎn)擊付費(fèi)廣告,當(dāng)用戶點(diǎn)擊某個(gè)投放廣告的媒體網(wǎng)站上的CPC廣告后,該媒體網(wǎng)站即會(huì)獲得相應(yīng)的廣告收入。隨著CPC廣告投放量越來(lái)越大,一些媒體網(wǎng)站為了獲取更大利益,使用軟件模擬正常用戶的廣告點(diǎn)擊行為。這些虛假點(diǎn)擊不能為廣告主實(shí)現(xiàn)利益轉(zhuǎn)化,確需要廣告主付費(fèi),損害了廣告主的利益,且不利于廣告生態(tài)的健康有序發(fā)展。
目前通常采用通過(guò)專家經(jīng)驗(yàn)確立規(guī)則或者通過(guò)簡(jiǎn)單統(tǒng)計(jì)方法來(lái)識(shí)別互聯(lián)網(wǎng)廣告的異常點(diǎn)擊行為。但這兩種方法在使用中均存在局限性,如根據(jù)專家經(jīng)驗(yàn)確立的規(guī)則過(guò)于固化,無(wú)法適應(yīng)作弊手段的變化;而簡(jiǎn)單統(tǒng)計(jì)方法處理數(shù)據(jù)空間有限,不能利于海量數(shù)據(jù)多維度精細(xì)化的分析。
在所述背景技術(shù)部分公開(kāi)的上述信息僅用于加強(qiáng)對(duì)本發(fā)明的背景的理解,因此它可以包括不構(gòu)成對(duì)本領(lǐng)域普通技術(shù)人員已知的現(xiàn)有技術(shù)的信息。
發(fā)明內(nèi)容
有鑒于此,本發(fā)明提供一種互聯(lián)網(wǎng)廣告異常點(diǎn)擊檢測(cè)方法、裝置、設(shè)備及可讀存儲(chǔ)介質(zhì),能夠有效實(shí)現(xiàn)異常點(diǎn)擊的自動(dòng)檢測(cè)。
本發(fā)明的其他特性和優(yōu)點(diǎn)將通過(guò)下面的詳細(xì)描述變得顯然,或部分地通過(guò)本發(fā)明的實(shí)踐而習(xí)得。
根據(jù)本發(fā)明的一方面,提供一種互聯(lián)網(wǎng)廣告異常點(diǎn)擊檢測(cè)方法,包括:從多條日志數(shù)據(jù)中分別篩選出廣告點(diǎn)擊量大于一預(yù)設(shè)的第一閾值的多個(gè)樣本數(shù)據(jù),所述樣本數(shù)據(jù)為基于不同維度聚合后的點(diǎn)擊量數(shù)據(jù);根據(jù)所述多個(gè)樣本數(shù)據(jù),基于配置化文件,分別確定相應(yīng)維度的各統(tǒng)計(jì)特征的特征值;建立所述各統(tǒng)計(jì)特征的特征值的第一高斯分布,并獲得各第一高斯分布的第一均值和第一標(biāo)準(zhǔn)差;以及根據(jù)所述各統(tǒng)計(jì)特征的特征值的第一高斯分布的第一均值和第一標(biāo)準(zhǔn)差,分別判斷所述多個(gè)樣本數(shù)據(jù)是否異常;其中,所述配置化文件包括用于確定所述各統(tǒng)計(jì)特征的特征值的計(jì)算算子。
根據(jù)本發(fā)明的一實(shí)施方式,根據(jù)所述各統(tǒng)計(jì)特征的特征值的第一高斯分布的第一均值和第一標(biāo)準(zhǔn)差,分別判斷所述多個(gè)樣本數(shù)據(jù)是否異常包括:針對(duì)各統(tǒng)計(jì)特征i,去除所述多個(gè)樣本數(shù)據(jù)中其統(tǒng)計(jì)特征i的特征值小于u(i)-2*σ(i)或者大于u(i)+2*σ(i)的樣本數(shù)據(jù),其中u(i)為統(tǒng)計(jì)特征i的特征值的第一高斯分布的第一均值,σ(i)為統(tǒng)計(jì)特征i的特征值的第一高斯分布的第一標(biāo)準(zhǔn)差;根據(jù)剩余的所述樣本數(shù)據(jù),分別重新建立相應(yīng)維度的各統(tǒng)計(jì)特征i的特征值的第二高斯分布,并重新獲得各第二高斯分布的第二均值u2(i)和第二標(biāo)準(zhǔn)差σ2(i);確定各統(tǒng)計(jì)特征i的特征值的第二高斯分布中的第一分位點(diǎn)概率密度Cp(i)、第二分位點(diǎn)概率密度Bp(i)及第三分位點(diǎn)概率密度Ap(i);分別確定所有統(tǒng)計(jì)特征的所述第一分位點(diǎn)概率密度的乘積Cp、所述第二分位點(diǎn)概率密度的乘積Bp及所述第三分位點(diǎn)概率密度的乘積Ap;分別計(jì)算各樣本數(shù)據(jù)的所有統(tǒng)計(jì)特征的特征值的乘積Y;以及根據(jù)Cp、Bp、Ap及各樣本數(shù)據(jù)的Y,分別判斷各樣本數(shù)據(jù)是否異常。
根據(jù)本發(fā)明的一實(shí)施方式,根據(jù)Cp、Bp、Ap及Y,分別判斷各樣本數(shù)據(jù)是否異常包括:當(dāng)所述樣本數(shù)據(jù)的Y小于Cp時(shí),確定該樣本數(shù)據(jù)為極端異常;當(dāng)所述樣本數(shù)據(jù)的Y小于Bp時(shí),確定該樣本數(shù)據(jù)為嚴(yán)重異常;當(dāng)所述樣本數(shù)據(jù)的Y小于Ap時(shí),確定該樣本數(shù)據(jù)為一般異常。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于北京京東尚科信息技術(shù)有限公司;北京京東世紀(jì)貿(mào)易有限公司,未經(jīng)北京京東尚科信息技術(shù)有限公司;北京京東世紀(jì)貿(mào)易有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710402564.1/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06F 電數(shù)字?jǐn)?shù)據(jù)處理
G06F11-00 錯(cuò)誤檢測(cè);錯(cuò)誤校正;監(jiān)控
G06F11-07 .響應(yīng)錯(cuò)誤的產(chǎn)生,例如,容錯(cuò)
G06F11-22 .在準(zhǔn)備運(yùn)算或者在空閑時(shí)間期間內(nèi),通過(guò)測(cè)試作故障硬件的檢測(cè)或定位
G06F11-28 .借助于檢驗(yàn)標(biāo)準(zhǔn)程序或通過(guò)處理作錯(cuò)誤檢測(cè)、錯(cuò)誤校正或監(jiān)控
G06F11-30 .監(jiān)控
G06F11-36 .通過(guò)軟件的測(cè)試或調(diào)試防止錯(cuò)誤
- 基于網(wǎng)絡(luò)電視的互聯(lián)網(wǎng)業(yè)務(wù)處理方法和系統(tǒng)
- 互聯(lián)網(wǎng)業(yè)務(wù)接入網(wǎng)關(guān)的實(shí)現(xiàn)方法和系統(tǒng)
- 一種互聯(lián)網(wǎng)電視終端安全訪問(wèn)互聯(lián)網(wǎng)的方法
- 一種互聯(lián)網(wǎng)應(yīng)用交互方法、裝置及系統(tǒng)
- 一種使用互聯(lián)網(wǎng)移動(dòng)攝像終端進(jìn)行異地圖像拍攝的系統(tǒng)
- 一種網(wǎng)絡(luò)電視終端安全訪問(wèn)互聯(lián)網(wǎng)的方法
- 利用區(qū)塊鏈保護(hù)用于互聯(lián)網(wǎng)資源分配的事務(wù)
- 互聯(lián)網(wǎng)廣告裝置及方法
- 中央管理服務(wù)器的互聯(lián)網(wǎng)連接方法及系統(tǒng)
- 互聯(lián)網(wǎng)節(jié)點(diǎn)中信任傳播方法、系統(tǒng)及相關(guān)產(chǎn)品
- 異常檢測(cè)裝置、異常檢測(cè)方法
- 異常檢測(cè)方法、異常檢測(cè)裝置及異常檢測(cè)系統(tǒng)
- 異常檢測(cè)裝置、異常檢測(cè)方法以及異常檢測(cè)系統(tǒng)
- 異常檢測(cè)裝置、異常檢測(cè)方法以及異常檢測(cè)系統(tǒng)
- 異常檢測(cè)裝置、異常檢測(cè)方法及異常檢測(cè)系統(tǒng)
- 異常探測(cè)裝置、異常探測(cè)方法以及計(jì)算機(jī)可讀取的存儲(chǔ)介質(zhì)
- 異常檢測(cè)裝置、異常檢測(cè)方法及記錄介質(zhì)
- 異常檢測(cè)裝置、異常檢測(cè)系統(tǒng)以及異常檢測(cè)方法
- 異常檢測(cè)系統(tǒng)、異常檢測(cè)裝置和異常檢測(cè)方法
- 異常檢測(cè)方法、異常檢測(cè)裝置及異常檢測(cè)系統(tǒng)





