[發明專利]網頁曝光數據采集方法、系統、電子設備和存儲介質在審
| 申請號: | 201810672066.3 | 申請日: | 2018-06-26 |
| 公開(公告)號: | CN108846116A | 公開(公告)日: | 2018-11-20 |
| 發明(設計)人: | 唐琪;曲曉雷;宋昆 | 申請(專利權)人: | 北京京東金融科技控股有限公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 北京律智知識產權代理有限公司 11438 | 代理人: | 王衛忠;袁禮君 |
| 地址: | 100176 北京市北京經濟*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 采集 數據采集信息 曝光數據 瀏覽器 視窗 存儲介質 電子設備 網頁代碼 網頁狀態 網頁 網頁訪問請求 網頁內容解析 動態采集 獨立配置 自動識別 監聽 遍歷 加載 解耦 上報 返回 響應 | ||
1.一種網頁曝光數據采集方法,其特征在于,包括如下步驟:
S10、響應網頁訪問請求,將網頁內容解析為DOM樹結構;
S20、加載所述網頁的數據采集信息,根據所述數據采集信息遍歷所述DOM樹結構,定位待采集DOM元素;
S30、根據各待采集DOM元素與瀏覽器當前視窗的相對位置,判斷各待采集DOM元素是否被顯示于瀏覽器當前視窗;
S40、當所述待采集DOM元素被顯示于瀏覽器當前視窗時,采集并上報被顯示的所述待采集DOM元素的曝光數據;
S50、監聽網頁狀態,當所述網頁狀態發生變化時,返回所述步驟S30。
2.如權利要求1所述的網頁曝光數據采集方法,其特征在于,所述步驟S50包括:
對所述網頁的DOM樹結構進行監聽;
當所述DOM樹結構中任一DOM元素發生變化時,返回所述步驟S30。
3.如權利要求2所述的網頁曝光數據采集方法,其特征在于,所述DOM元素的變化包括:DOM元素增加、DOM元素刪除和DOM元素修改。
4.如權利要求1所述的網頁曝光數據采集方法,其特征在于,所述步驟S50包括:
對所述網頁的滾動事件進行監聽;
當所述網頁發生滾動時,返回所述步驟S30。
5.如權利要求1所述的網頁曝光數據采集方法,其特征在于,所述步驟S30包括:
獲取各待采集DOM元素的坐標信息,根據所述待采集DOM元素的坐標信息計算其中心位置;
當所述待采集DOM元素的中心位置位于瀏覽器當前視窗時,判斷所述待采集DOM元素被顯示于瀏覽器當前視窗。
6.如權利要求1所述的網頁曝光數據采集方法,其特征在于,上報所述曝光數據時,各被顯示的待采集DOM元素的曝光數據采用唯一對應所述待采集DOM元素的標識ID進行標識。
7.如權利要求1所述的網頁曝光數據采集方法,其特征在于,所述曝光數據包括被顯示的所述待采集DOM元素的曝光量和點擊量。
8.一種網頁曝光數據采集系統,其特征在于,包括如下模塊:
解析模塊,響應網頁訪問請求,將網頁內容解析為DOM樹結構;
DOM元素定位模塊,加載所述網頁的數據采集信息,根據所述數據采集信息遍歷所述DOM樹結構,定位待采集DOM元素;
位置判斷模塊,根據各待采集DOM元素與瀏覽器當前視窗的相對位置,判斷各待采集DOM元素是否被顯示于瀏覽器當前視窗;
采集模塊,當所述待采集DOM元素被顯示于瀏覽器當前視窗時,采集并上報被顯示的所述待采集DOM元素的曝光數據;
監聽模塊,監聽網頁狀態,當所述網頁狀態發生變化時,觸發所述位置判斷模塊。
9.如權利要求8所述的網頁曝光數據采集系統,其特征在于,所述監聽模塊包括:
DOM樹監聽單元,對所述網頁的DOM樹結構進行監聽,當所述DOM樹結構中任一DOM元素發生變化時,觸發所述位置判斷模塊。
10.如權利要求8所述的網頁曝光數據采集系統,其特征在于,所述監聽模塊包括:
滾動監聽單元,對所述網頁的滾動事件進行監聽,當所述網頁發生滾動時,觸發所述位置判斷模塊。
11.如權利要求8所述的網頁曝光數據采集系統,其特征在于,所述位置判斷模塊執行:
獲取各待采集DOM元素的坐標信息,根據所述待采集DOM元素的坐標信息計算其中心位置;
當所述待采集DOM元素的中心位置位于瀏覽器當前視窗時,判斷所述待采集DOM元素被顯示于瀏覽器當前視窗。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京京東金融科技控股有限公司,未經北京京東金融科技控股有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810672066.3/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:內容傳播方法、裝置及服務器
- 下一篇:商業快訊的去重篩選方法及裝置





