[發明專利]站點訪問的統計方法、裝置、計算機設備和存儲介質在審
| 申請號: | 201811279067.8 | 申請日: | 2018-10-30 |
| 公開(公告)號: | CN111125479A | 公開(公告)日: | 2020-05-08 |
| 發明(設計)人: | 許東武;楊鎮育;李廷威;曾劍青 | 申請(專利權)人: | 廣州要啦網絡有限公司 |
| 主分類號: | G06F16/951 | 分類號: | G06F16/951;G06F16/95 |
| 代理公司: | 廣州華進聯合專利商標代理有限公司 44224 | 代理人: | 馮右明 |
| 地址: | 510660 廣東省廣*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 站點 訪問 統計 方法 裝置 計算機 設備 存儲 介質 | ||
本申請涉及一種站點訪問的統計方法、裝置、計算機設備和存儲介質,計算機設備通過獲取對站點采集的訪問數據,并通過實時流式處理系統對訪問數據進行處理,按照第一預設時長完成統計,然后,將統計結果以集合形式寫入緩存服務器,并對緩存服務器中的數據集合按照第二預設時長進行統計,最終得到目標統計結果。由于采用實時流式處理系統對訪問數據進行處理,可以提高數據處理的效率,從而提高站點訪問統計的實時性;進一步地,由于將上述數據集合寫入緩存服務器,可以通過降低寫入耗時,來降低數據的時延,因此,站點訪問的統計結果更準確。
技術領域
本申請涉及數據統計技術領域,特別是涉及一種站點訪問的統計方法、裝置、計算機設備和存儲介質。
背景技術
目前,有大量的網站存在統計在線人數的需求,用來分析網站的訪問情況和人氣值,部分網站也會在網站上顯示該網站實時在線人數,站長或者運營人員可據此對網站內容發布、數據收集甚至是廣告推送等進行相應的優化,有助于提高網站的投資回報率。
為了統計在線訪問人數,目前采用數據庫統計方案,首先將采集到的站點訪問數據存儲到數據庫,然后對訪問數據進行統計處理,得到訪問該站點的人數。
但是,使用數據庫統計方案,由于對數據的寫入和處理需要的時間比較長,存在實時性差,數據延遲較高的問題,導致統計結果不準確。
發明內容
基于此,有必要針對上述技術問題,提供一種站點訪問的統計方法、裝置、計算機設備和存儲介質。
一種站點訪問的統計方法,所述方法包括:
獲取對站點采集的訪問數據;
通過實時流式處理系統對所述訪問數據按照第一預設時長進行統計,并將每個所述第一預設時長的統計結果形成一個數據集合;所述數據集合包含站點標識、用戶IP地址、會話標識以及訪問時間中的至少兩種參數;
將所述數據集合寫入緩存服務器;
對所述緩存服務器的數據集合按照第二預設時長進行統計,得到目標統計結果。
在其中一個實施例中,所述獲取對站點采集的訪問數據,包括:
從消息隊列中獲取對站點采集的訪問數據,所述訪問數據是由采集服務器對接收的訪問數據經過過濾處理和序列化處理后發送給所述消息隊列的,所述采集服務器接收的訪問數據是由反向代理服務器發送的訪問數據,所述反向代理服務器上的訪問數據是由采集終端對站點采集的訪問數據并發送給反向代理服務器的。
在其中一個實施例中,所述通過實時流式處理系統對所述訪問數據按照第一預設時長進行統計,并將每個所述第一預設時長的統計結果形成一個數據集合,包括:
通過實時流式處理系統從所述訪問數據中提取參數,對所述參數按照第一預設時長進行統計,并將每個所述第一預設時長的統計結果形成一個數據集合。
在其中一個實施例中,在所述獲取對站點的訪問數據之后,還包括:
將所述訪問數據存儲到分布式數據庫;
當檢測到所述訪問數據存儲時長超過存儲時長閾值,則觸發數據清理請求。
在其中一個實施例中,所述方法還包括:
當所述數據集合寫入到緩存服務器中的時刻距離當前時刻超過預設的有效時長,則所述數據集合自動失效。
在其中一個實施例中,對所述緩存服務器的數據集合按照第二預設時長進行統計,得到目標統計結果,包括:
獲取統計指令;
根據所述統計指令對所述數據集合,按照第二預設時長進行統計,得到二次統計結果;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于廣州要啦網絡有限公司,未經廣州要啦網絡有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811279067.8/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種管道混合器
- 下一篇:石油烴制備低碳烯烴的方法及裝置





