[發(fā)明專利]確定頁面訪問的流量來源的方法和裝置有效
| 申請?zhí)枺?/td> | 201711205737.7 | 申請日: | 2017-11-27 |
| 公開(公告)號: | CN110020364B | 公開(公告)日: | 2021-11-30 |
| 發(fā)明(設(shè)計)人: | 趙鵬程;鐘雨;崔波 | 申請(專利權(quán))人: | 北京京東尚科信息技術(shù)有限公司;北京京東世紀(jì)貿(mào)易有限公司 |
| 主分類號: | G06F16/958 | 分類號: | G06F16/958 |
| 代理公司: | 中原信達(dá)知識產(chǎn)權(quán)代理有限責(zé)任公司 11219 | 代理人: | 張一軍;楊曉偉 |
| 地址: | 100195 北京市海淀區(qū)杏石口路6*** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 確定 頁面 訪問 流量 來源 方法 裝置 | ||
本發(fā)明公開了確定頁面訪問的流量來源的方法和裝置,涉及計算機技術(shù)領(lǐng)域。該方法的一具體實施方式包括:獲取第一時間段內(nèi)的一個或多個頁面訪問記錄,和第二時間段內(nèi)的一個或多個廣告點擊記錄;提取第一時間段內(nèi)的每一個頁面訪問記錄和第二時間段內(nèi)的每一個廣告點擊記錄的特征,以獲得頁面訪問記錄的特征數(shù)據(jù)和廣告點擊記錄的特征數(shù)據(jù),并得到由所有特征數(shù)據(jù)組成的特征數(shù)據(jù)集合;在所述特征數(shù)據(jù)集合中,根據(jù)每一個頁面訪問記錄的特征數(shù)據(jù)對應(yīng)的最近一次廣告點擊記錄的特征數(shù)據(jù)判斷該頁面訪問記錄的流量來源類型。該實施方式高效快速,且能夠準(zhǔn)確對流量日志進行去重。
技術(shù)領(lǐng)域
本發(fā)明涉及計算機技術(shù)領(lǐng)域,尤其涉及一種確定頁面訪問的流量來源的方法和裝置。
背景技術(shù)
網(wǎng)站流量是指網(wǎng)站的訪問量,用來描述訪問一個網(wǎng)站的用戶數(shù)量以及用戶所瀏覽的網(wǎng)頁數(shù)量等指標(biāo)。為了提高網(wǎng)站流量,電子商務(wù)平臺通常利用多種渠道進行引流,例如依靠展示廣告和搜索廣告等付費引流方式,或者利用電商平臺的展示樓層和營銷活動等免費引流方式。為了在提升網(wǎng)站流量的同時保證流量良好的轉(zhuǎn)化,供應(yīng)商需要對各渠道的流量對總體的貢獻以及各渠道的流量的質(zhì)量進行評價,這就需要建立全面、統(tǒng)一的流量渠道體系,對每個渠道帶來的流量和轉(zhuǎn)化進行合理的劃分和統(tǒng)計,而其前提就是對網(wǎng)站頁面訪問流量的來源進行分析。
現(xiàn)有的對頁面訪問流量的來源進行分析的方法是通過數(shù)據(jù)倉庫對流量日志和廣告點擊日志進行聯(lián)合查詢,然后通過查詢結(jié)果進行后續(xù)的流量來源的確定。
在實現(xiàn)本發(fā)明過程中,發(fā)明人發(fā)現(xiàn)現(xiàn)有技術(shù)中至少存在如下問題:現(xiàn)有技術(shù)的方法在處理數(shù)十億的流量日志和數(shù)億的廣告點擊日志時,速度較慢,效率較低。
因此,亟需一種高效快速的確定網(wǎng)站頁面訪問的流量來源的方法和裝置。
發(fā)明內(nèi)容
有鑒于此,本發(fā)明實施例提供一種確定網(wǎng)站頁面訪問的流量來源的方法和裝置,能夠高效快速的處理大量的日志數(shù)據(jù)。
為實現(xiàn)上述目的,根據(jù)本發(fā)明實施例的一個方面,提供了一種確定頁面訪問的流量來源的方法,包括:
獲取第一時間段內(nèi)的一個或多個頁面訪問記錄,和第二時間段內(nèi)的一個或多個廣告點擊記錄;
提取第一時間段內(nèi)的每一個頁面訪問記錄和第二時間段內(nèi)的每一個廣告點擊記錄的特征,以獲得頁面訪問記錄的特征數(shù)據(jù)和廣告點擊記錄的特征數(shù)據(jù),并得到由所有特征數(shù)據(jù)組成的特征數(shù)據(jù)集合;
在所述特征數(shù)據(jù)集合中,根據(jù)每一個頁面訪問記錄的特征數(shù)據(jù)對應(yīng)的最近一次廣告點擊記錄的特征數(shù)據(jù)判斷該頁面訪問記錄的流量來源類型。
進一步的,所述頁面訪問記錄的特征包括:訪問時間和訪問設(shè)備號;廣告點擊記錄的特征包括:點擊時間和點擊設(shè)備號;
在所述判斷頁面訪問記錄的流量來源類型的步驟之前,對所述特征數(shù)據(jù)集合進行排序,以得到該集合的一個或多個分區(qū),其中,所述分區(qū)中包括:相同設(shè)備號的一個或多個特征數(shù)據(jù),在所述分區(qū)中所述特征數(shù)據(jù)按照時間由遠(yuǎn)至近排序;
所述頁面訪問記錄的特征數(shù)據(jù)對應(yīng)的最近一次廣告點擊記錄的特征數(shù)據(jù)為在所述特征數(shù)據(jù)集合中排序在該頁面訪問記錄的特征數(shù)據(jù)之前且距離最近的廣告點擊記錄的特征數(shù)據(jù)。
進一步的,所述判斷頁面訪問記錄的流量來源類型的步驟包括:
對所述特征數(shù)據(jù)集合中的每個特征數(shù)據(jù)執(zhí)行下述流量來源判斷過程:
免費流量判斷步驟:若當(dāng)前特征數(shù)據(jù)為頁面訪問記錄的特征數(shù)據(jù),則判斷該特征數(shù)據(jù)與其最近一次廣告點擊記錄的特征數(shù)據(jù)的設(shè)備號是否相同,若不同,則確定該頁面訪問記錄的流量來源類型為免費流量;
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于北京京東尚科信息技術(shù)有限公司;北京京東世紀(jì)貿(mào)易有限公司,未經(jīng)北京京東尚科信息技術(shù)有限公司;北京京東世紀(jì)貿(mào)易有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201711205737.7/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 存儲器訪問調(diào)度裝置、調(diào)度方法與存儲器訪問控制系統(tǒng)
- 一種限制用戶訪問的方法和裝置
- 一種訪問信息提供方法及系統(tǒng)
- 數(shù)據(jù)訪問權(quán)限的控制方法及裝置
- 基于智能家居系統(tǒng)的訪問授權(quán)方法、裝置及設(shè)備
- 網(wǎng)站訪問請求的動態(tài)調(diào)度方法及裝置
- 基于訪問頻率的監(jiān)測方法、裝置、設(shè)備和計算機存儲介質(zhì)
- 訪問憑證驗證方法、裝置、計算機設(shè)備及存儲介質(zhì)
- 一種應(yīng)用訪問控制方法、系統(tǒng)和介質(zhì)
- 異常訪問行為的檢測方法、裝置、電子設(shè)備及存儲介質(zhì)





