[發明專利]網頁曝光數據采集方法、系統、電子設備和存儲介質在審
| 申請號: | 201810672066.3 | 申請日: | 2018-06-26 |
| 公開(公告)號: | CN108846116A | 公開(公告)日: | 2018-11-20 |
| 發明(設計)人: | 唐琪;曲曉雷;宋昆 | 申請(專利權)人: | 北京京東金融科技控股有限公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 北京律智知識產權代理有限公司 11438 | 代理人: | 王衛忠;袁禮君 |
| 地址: | 100176 北京市北京經濟*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 采集 數據采集信息 曝光數據 瀏覽器 視窗 存儲介質 電子設備 網頁代碼 網頁狀態 網頁 網頁訪問請求 網頁內容解析 動態采集 獨立配置 自動識別 監聽 遍歷 加載 解耦 上報 返回 響應 | ||
本發明提供網頁曝光數據采集方法、系統、電子設備和存儲介質,其中方法包括:S10、響應網頁訪問請求,將網頁內容解析為DOM樹結構;S20、加載網頁的數據采集信息,根據所述數據采集信息遍歷所述DOM樹結構,定位待采集DOM元素;S30、根據各待采集DOM元素與瀏覽器當前視窗的相對位置,判斷各待采集DOM元素是否被顯示于瀏覽器當前視窗;S40、當待采集DOM元素被顯示于瀏覽器當前視窗時,采集并上報被顯示的待采集DOM元素的曝光數據;S50、監聽網頁狀態,當網頁狀態發生變化時,返回步驟S30。本發明將數據采集信息和網頁代碼分開獨立配置,實現網頁代碼和埋點采集代碼解耦;通過數據采集信息自動識別待采集DOM元素,動態采集曝光數據。
技術領域
本發明涉及互聯網技術領域,具體地說,涉及一種網頁曝光數據采集方法、系統、電子設備和存儲介質。
背景技術
隨著移動互聯網越來越流行,如何合理地規劃網頁和監聽網頁變得越來越重要。基于大數據的設計,更適應當前的環境,網頁數據的采集要求也變得更細化,更準確。
傳統網頁監聽只統計網頁的打開次數。但是網頁被打開以后,用戶只能看到網頁的一部分,網頁其余部分是在屏幕之外未被顯示的,需要用戶滾動瀏覽器滾動條才能看到。
現階段的網頁監聽需要精確統計網頁中不同模塊被用戶真實看到的次數。采用的方法通常是模塊開發人員在開發模塊的時候,加入埋點的相關代碼,來監聽瀏覽器滾動條和模塊的狀態切換,當用戶看到特定模塊的時候,觸發埋點方法,上報對應的數據。
具體來說,這種埋點方法需要在網頁的模塊代碼中加入兩種埋點代碼,一是埋點標識代碼,用于標識模塊;二是埋點統計上報代碼,在特定模塊被顯示的時候,調用埋點統計上報代碼,上報數據。
這種埋點方法會占用一部分開發時間,與業務代碼耦合。另外,埋點代碼一般是數據部門管理,而模塊代碼則由各業務線的研發人員維護,在跨部門合作中,這些埋點代碼管理特別復雜,耗費資源。
需要說明的是,在上述背景技術部分公開的信息僅用于加強對本發明的背景的理解,因此可以包括不構成對本領域普通技術人員已知的現有技術的信息。
發明內容
針對現有技術中的問題,本發明提供一種網頁曝光數據采集方法、系統、電子設備和存儲介質,解決埋點代碼與業務代碼耦合造成開發時間長,效率低,且維護困難,資源耗費的問題。
根據本發明的一個方面,提供一種網頁曝光數據采集方法,包括步驟:S10、響應網頁訪問請求,將網頁內容解析為DOM樹結構;S20、加載所述網頁的數據采集信息,根據所述數據采集信息遍歷所述DOM樹結構,定位待采集DOM元素;S30、根據各待采集DOM元素與瀏覽器當前視窗的相對位置,判斷各待采集DOM元素是否被顯示于瀏覽器當前視窗;S40、當所述待采集DOM元素被顯示于瀏覽器當前視窗時,采集并上報被顯示的所述待采集DOM元素的曝光數據;S50、監聽網頁狀態,當所述網頁狀態發生變化時,返回所述步驟S30。
優選地,上述的網頁曝光數據采集方法中,所述步驟S50包括:對所述網頁的DOM樹結構進行監聽;當所述DOM樹結構中任一DOM元素發生變化時,返回所述步驟S30。
優選地,上述的網頁曝光數據采集方法中,所述DOM元素的變化包括:DOM元素增加、DOM元素刪除和DOM元素修改。
優選地,上述的網頁曝光數據采集方法中,所述步驟S50包括:對所述網頁的滾動事件進行監聽;當所述網頁發生滾動時,返回所述步驟S30。
優選地,上述的網頁曝光數據采集方法中,所述步驟S30包括:獲取各待采集DOM元素的坐標信息,根據所述待采集DOM元素的坐標信息計算其中心位置;當所述待采集DOM元素的中心位置位于瀏覽器當前視窗時,判斷所述待采集DOM元素被顯示于瀏覽器當前視窗。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京京東金融科技控股有限公司,未經北京京東金融科技控股有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810672066.3/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:內容傳播方法、裝置及服務器
- 下一篇:商業快訊的去重篩選方法及裝置





