[發明專利]無埋點式云端收集分析瀏覽器Trace的方法及系統有效
| 申請號: | 201710787168.5 | 申請日: | 2017-09-04 |
| 公開(公告)號: | CN107562426B | 公開(公告)日: | 2020-01-10 |
| 發明(設計)人: | 劉云浩;楊啟凡;李振華 | 申請(專利權)人: | 清華大學 |
| 主分類號: | G06F8/38 | 分類號: | G06F8/38;G06F8/41 |
| 代理公司: | 11002 北京路浩知識產權代理有限公司 | 代理人: | 王瑩;李官 |
| 地址: | 100084 北京市海*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 計算機 網頁 瀏覽器 追蹤 云端 互聯網技術 瀏覽器代理 編程框架 二次開發 分析處理 分析功能 分析計算 建立通信 配置文件 信息發送 運行過程 中計算機 代理 運行時 點式 網站 回復 分析 轉發 配置 訪問 開發 | ||
1.一種無埋點式云端收集分析瀏覽器Trace的方法,其特征在于,包括以下步驟:
計算機a根據計算機b提供的PAC配置文件設置計算機a瀏覽器的代理規則;
計算機a在訪問計算機c所提供的符合所述規則的網頁時,請求由計算機b進行代理,以使計算機b依據規則在計算機c向計算機a回復的網頁信息中注入追蹤代碼并將所述網頁信息轉發至計算機a;
計算機a在運行網頁時,通過追蹤代碼將與計算機d建立通信,并在網頁解析與運行過程中,將指定追蹤的API調用信息分批發送至計算機d,以供計算機d對網頁在計算機a上的每次運行生成分析結果;
所述計算機b依據規則在計算機c向計算機a回復的網頁信息中注入追蹤代碼并將所述網頁信息轉發至計算機a,進一步包括:
計算機b依據計算機a發出的網頁訪問HTTP/HTTPS請求中路徑查詢的inject字段取值來動態選擇注入的追蹤代碼類型,依據預先配置在計算機b上的配置文件中聲明的該追蹤代碼類型獲取對應的追蹤代碼;計算機b依次在計算機c提供的HTTP/HTTPS網頁回復信息中的body字段首部注入工具代碼庫和開發者追蹤代碼;
所述計算機a在運行網頁時,通過追蹤代碼將與計算機d建立通信,進一步包括:
計算機a在運行網頁時首先執行開發者追蹤代碼,通過所述開發者追蹤代碼將在瀏覽器內部監聽指定函數的調用;其中,預先配置在計算機b上的工具代碼庫提供的函數用于與計算機d指定TCP端口提供的分析服務建立WebSocket連接;計算機d的IP或域名由計算機b在注入追蹤代碼時指定;
當追蹤代碼與計算機d完成WebSocket的建立后,計算機d初始化預先配置在計算機d上的分析模塊,并進入等待分析的狀態;
所述在網頁解析與運行過程中,將指定追蹤的API調用信息分批發送至計算機d,進一步包括:
計算機a利用網頁上原程序調用瀏覽器原生函數F的被監聽的函數句柄F’,基于追蹤代碼通過F’獲取到原程序調用函數的參數列表;
基于追蹤代碼調用瀏覽器提供的原函數句柄F,獲得函數返回值;
基于追蹤函數將包含調用的函數簽名、參數列表和返回值的函數調用記錄進行二進制壓縮編碼后暫存在緩沖區,并將所述返回值返回給網頁原程序;
當所述緩沖區的存儲量達到指定閾值時,基于追蹤代碼將緩沖區中的所有函數調用記錄拷貝至數據發送線程,清空緩沖區,并通知數據發送線程向計算機d發送編碼后的函數調用記錄;
計算機d在接收到函數調用記錄后,使用分析模塊分析解碼后的調用記錄列表。
2.根據權利要求1所述的方法,其特征在于,所述根據計算機b提供的PAC配置文件設置計算機a瀏覽器的代理規則包括:
配置文件的代理規則僅對Html協議傳輸的網頁生效,圖片資源文件、視頻資源文件、音頻資源文件、JavaScript代碼文件以及CSS代碼文件將被過濾,WebSocket連接將被過濾;配置文件中計算機d的地址將依據計算機b中所配置的IP或域名動態生成。
3.根據權利要求1所述的方法,其特征在于,對所述函數調用記錄進行二進制壓縮編碼方式包括:
分三級緩沖區,每一級均包含8byte長度的頭部,其中4byte標明緩沖區級別,取值1~3;余下4byte標明緩沖區的字節數;
第一級緩沖區為函數調用記錄,每一條記錄為8byte;其中,前2byte存儲函數編號,之后的2byte存儲函數返回值,最后4byte存儲調用記錄的參數列表在第二級緩沖區中的地址;
第二級緩沖區為參數列表存儲區;每一條參數列表的記錄長度不固定,每一條記錄由如下部分組成:2byte用于存儲參數列表字節數,2byte用于存儲參數列表長度n,余下的byte存儲n個參數;每個參數長度可變,所述參數由如下部分組成:1byte存儲一級參數類型,3byte存儲二級參數類型,對于指定類型的參數還包括4byte存儲參數在第三級緩沖區中的地址,4byte存儲參數字節數;
對于數組和字符串類型,其實際值存儲在第三級緩沖區中。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于清華大學,未經清華大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710787168.5/1.html,轉載請聲明來源鉆瓜專利網。





