[發(fā)明專利]識(shí)別基于DBSCAN模型的非正常批量購(gòu)票行為的方法在審
| 申請(qǐng)?zhí)枺?/td> | 201611019839.5 | 申請(qǐng)日: | 2016-11-18 |
| 公開(公告)號(hào): | CN106657007A | 公開(公告)日: | 2017-05-10 |
| 發(fā)明(設(shè)計(jì))人: | 曹杰;馮雨暉;宿曉坤;楊睿;李學(xué)超 | 申請(qǐng)(專利權(quán))人: | 北京紅馬傳媒文化發(fā)展有限公司 |
| 主分類號(hào): | H04L29/06 | 分類號(hào): | H04L29/06;H04L12/26;G06Q30/06 |
| 代理公司: | 北京天奇智新知識(shí)產(chǎn)權(quán)代理有限公司11340 | 代理人: | 楊文錄 |
| 地址: | 100027 北京*** | 國(guó)省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說(shuō)明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 識(shí)別 基于 dbscan 模型 正常 批量 購(gòu)票 行為 方法 | ||
技術(shù)領(lǐng)域
本發(fā)明涉及異常行為識(shí)別技術(shù)領(lǐng)域,尤其涉及一種識(shí)別基于DBSCAN模型的非正常批量購(gòu)票行為的方法。
背景技術(shù)
現(xiàn)場(chǎng)演出票由于價(jià)錢高資源少,會(huì)引來(lái)大量的黃牛前來(lái)刷票(網(wǎng)絡(luò)購(gòu)票異常行為),然后高價(jià)倒賣,黃牛的出現(xiàn),損害用戶的利益,極大的降低了網(wǎng)上購(gòu)票的用戶體驗(yàn)和平臺(tái)的用戶粘性。黃牛為了搶票,經(jīng)常會(huì)通過(guò)機(jī)器批量注冊(cè)很多賬戶,還會(huì)通過(guò)多個(gè)賬戶進(jìn)行高頻,大量的訪問,以最快的速度下單占有資源。所以黃牛一般會(huì)通過(guò)程序進(jìn)行刷票。目前識(shí)別黃牛大都是通過(guò)統(tǒng)計(jì)用戶的訪問來(lái)源,訪問頻次,訪問周期,從中找出異于大多數(shù)用戶的訪問異常,從而判定為黃牛。建立黃牛黑名單。黃牛的定義并不一定是一個(gè)真正的用戶,也可以是一個(gè)資源,黃牛使用該資源進(jìn)行刷票,將此資源也納入到黃牛黑名單中,因而,會(huì)有IP黑名單,Cookie黑名單,賬號(hào)黑名單等。
當(dāng)前的識(shí)別黃牛的方式主要通過(guò)監(jiān)控訪問日志,通過(guò)解析,計(jì)算日志中的IP,Cookie,設(shè)備,賬號(hào)的訪問頻次,訪問時(shí)間間隔,來(lái)識(shí)別異常訪問,這在一定程度上能夠防止黃牛。但是應(yīng)用上述技術(shù)的時(shí)候,發(fā)明人發(fā)現(xiàn),單一維度的識(shí)別,不能夠唯一判別用戶設(shè)備,容易誤殺正常用戶,比如IP,黃牛和正常用戶在同一個(gè)樓或是小區(qū),用同一個(gè)出口IP,如果使用IP識(shí)別,容易誤殺正常用戶。第二,頻次識(shí)別只能是在一定程度上識(shí)別黃牛,當(dāng)黃牛拉大訪問間隔,降低訪問頻次,就不好判定。而且黃牛會(huì)模擬不同的客戶端,多渠道的進(jìn)行刷票。黃牛為了快速搶票,會(huì)走捷徑,不會(huì)像正常用戶操作,因而其行為軌跡也缺失關(guān)鍵步驟,所以當(dāng)前基于流量訪問異常的識(shí)別方法,已不滿足識(shí)別黃牛的需要。
發(fā)明內(nèi)容
為了解決上述技術(shù)問題,本發(fā)明提供了一種識(shí)別基于DBSCAN模型的非正常批量購(gòu)票行為的方法,可以將網(wǎng)絡(luò)批量購(gòu)票異常行為特征從正常購(gòu)票行為特征中識(shí)別出來(lái),進(jìn)行隔離,并降低誤識(shí)別概率,使資源的分配更具合理性和公平性。
本發(fā)明提供了一種識(shí)別基于DBSCAN模型的非正常批量購(gòu)票行為的方法,包括:
監(jiān)測(cè)預(yù)定時(shí)間段內(nèi)的注冊(cè)數(shù)量高于參考時(shí)間段的注冊(cè)數(shù)量的識(shí)別閾值后,獲取基于密度聚類算法掃描所述預(yù)識(shí)別時(shí)間段內(nèi)的所有注冊(cè)行為后標(biāo)記的至少一個(gè)高度集中的注冊(cè)賬戶簇;
將所述標(biāo)記的至少一個(gè)高度集中的注冊(cè)賬戶簇的網(wǎng)絡(luò)購(gòu)票行為記錄中的用戶IP、Cookie和訪問代理環(huán)境Agent哈希化為一個(gè)全局唯一的編碼字符串IP+Cookie+Agent,形成唯一用戶標(biāo)識(shí);
提取所述用戶標(biāo)識(shí)的歷史網(wǎng)絡(luò)購(gòu)票行為記錄和實(shí)時(shí)網(wǎng)絡(luò)購(gòu)票行為記錄中的網(wǎng)絡(luò)購(gòu)票行為屬性;
識(shí)別所述網(wǎng)絡(luò)購(gòu)票行為屬性中的異常行為屬性的用戶IP,將所述異常行為屬性的用戶IP存入黑名單進(jìn)行隔離。
進(jìn)一步的,所述將網(wǎng)絡(luò)購(gòu)票行為記錄中的用戶IP、Cookie和訪問代理環(huán)境Agent哈希化為一個(gè)全局唯一的編碼字符串IP+Cookie+Agent,形成唯一用戶標(biāo)識(shí),包括:
通過(guò)哈希函數(shù)將網(wǎng)絡(luò)購(gòu)票行為記錄中的用戶IP、Cookie和訪問代理環(huán)境Agent哈希化為一個(gè)全局唯一的編碼字符串IP+Cookie+Agent,形成唯一用戶標(biāo)識(shí)。
進(jìn)一步的,所述識(shí)別所述網(wǎng)絡(luò)購(gòu)票行為屬性中的異常行為屬性的用戶IP,將所述異常行為屬性的用戶IP存入黑名單進(jìn)行隔離,包括:
識(shí)別所述網(wǎng)絡(luò)購(gòu)票行為屬性中的頻次閥值和黑名單,所述頻次閥值包括但不限于:不同IP訪問頻次、每個(gè)IP的訪問不同url的頻次、IP+cookie+agent訪問頻次或IP+cookie+agent訪問不同url的頻次中的一種或多種;
通過(guò)所述頻次閥值和黑名單識(shí)別出異常行為的用戶IP,將所述識(shí)別出的用戶IP存入黑名單進(jìn)行隔離。
進(jìn)一步的,所述提取所述用戶標(biāo)識(shí)的歷史網(wǎng)絡(luò)購(gòu)票行為記錄和實(shí)時(shí)網(wǎng)絡(luò)購(gòu)票行為記錄中的網(wǎng)絡(luò)購(gòu)票行為屬性,包括:
提取所述用戶標(biāo)識(shí)中的歷史行為記錄中的歷史頻次閥值和歷史黑名單;
提取所述用戶標(biāo)識(shí)中的歷史交易行為記錄中存在潛在的購(gòu)買行為異常閥值和超出購(gòu)買行為異常閥值的異常注冊(cè)用戶的黑名單;
實(shí)時(shí)采集用戶標(biāo)識(shí)的當(dāng)前訪問行為記錄中的當(dāng)前用戶訪問頻次和路徑。
進(jìn)一步的,所述提取所述用戶標(biāo)識(shí)中的歷史行為記錄中的歷史頻次閥值,包括以下步驟:
將歷史行為記錄中的日志文件內(nèi)容載入到大數(shù)據(jù)數(shù)倉(cāng)Hive中,在Hive中建立日志文件格式化數(shù)據(jù)表,將日志文件內(nèi)容格式化到數(shù)據(jù)表中;
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于北京紅馬傳媒文化發(fā)展有限公司,未經(jīng)北京紅馬傳媒文化發(fā)展有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201611019839.5/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 識(shí)別媒體、識(shí)別媒體的識(shí)別方法、識(shí)別對(duì)象物品以及識(shí)別裝置
- 一種探針卡識(shí)別裝置和方法
- 識(shí)別裝置、識(shí)別方法以及記錄介質(zhì)
- 識(shí)別裝置、識(shí)別系統(tǒng),識(shí)別方法以及存儲(chǔ)介質(zhì)
- 識(shí)別程序、識(shí)別方法以及識(shí)別裝置
- 車載身份識(shí)別方法及系統(tǒng)
- 車載身份識(shí)別方法及系統(tǒng)
- 車載身份識(shí)別方法及系統(tǒng)
- 識(shí)別裝置、識(shí)別方法以及識(shí)別程序
- 識(shí)別裝置、識(shí)別方法及識(shí)別程序
- 基于密度聚類法和形態(tài)學(xué)聚類法的駕駛員注視點(diǎn)聚類方法
- 一種基于剪枝方式的DBSCAN分塊優(yōu)化方法
- 一種基于MVO改進(jìn)的DBSCAN礦井突水光譜識(shí)別方法
- 一種基于DBSCAN對(duì)密度不規(guī)則數(shù)據(jù)進(jìn)行異常挖掘的改進(jìn)算法
- 一種基于DBSCAN密度聚類的交叉口信號(hào)控制方法、裝置及系統(tǒng)
- 一種基于聚簇輪廓的網(wǎng)絡(luò)異常檢測(cè)方法
- 基于DBSCAN算法的互聯(lián)網(wǎng)金融欺詐行為檢測(cè)方法
- 開關(guān)柜狀態(tài)評(píng)估方法和裝置
- 一種基于改進(jìn)的DBSCAN算法的網(wǎng)頁(yè)去重方法
- 一種利用DBSCAN聚類算法識(shí)別云團(tuán)的方法、裝置及電子設(shè)備





