[發明專利]一種基于內容關聯的Web追蹤自動檢測方法有效
| 申請號: | 201711282970.5 | 申請日: | 2017-12-07 |
| 公開(公告)號: | CN108171074B | 公開(公告)日: | 2021-03-26 |
| 發明(設計)人: | 楊明;周佳歡;羅軍舟;吳文甲;凌振 | 申請(專利權)人: | 東南大學 |
| 主分類號: | G06F21/62 | 分類號: | G06F21/62 |
| 代理公司: | 南京蘇高專利商標事務所(普通合伙) 32204 | 代理人: | 柏尚春 |
| 地址: | 210096 江*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 內容 關聯 web 追蹤 自動檢測 方法 | ||
本發明公開了一種基于內容關聯的Web追蹤自動檢測方法,涉及Web用戶隱私保護領域,主要解決部分Web站點在用戶不知情的情況下收集、泄漏用戶敏感信息的問題。本發明以瀏覽器擴展的形式收集用戶對Web頁面的操作行為以及頁面元素信息,通過文本分析和圖像識別等技術分析比較前后訪問的頁面內容與用戶操作的關聯性,從而判斷該Web站點是否在收集用戶信息。由于日益發展的Web追蹤技術能夠避開傳統的檢測方法,因此本發明從Web追蹤效果入手,不僅能夠有效檢測用戶隱私泄漏問題,還能幫助研究人員發現新型的追蹤手段。
技術領域
本發明涉及Web用戶隱私保護方法,具體涉及一種基于頁面內容關聯性的Web追蹤自動檢測方法。
背景技術
隨著Web技術及業務的快速普及,越來越多的用戶已經離不開Web。與此同時,Web站點與廣告服務商希望通過設備識別進行有效的內容推薦以及更加精確的廣告投放,但是部分廣告商相互“合作”,販賣用戶隱私信息,從而實現跨域用戶關聯,進而分析用戶的行為習慣和喜好,這在很大程度上違背了用戶的隱私保護意愿。目前,基于Web的設備識別手段主要包括Cookie、瀏覽器指紋。其中Cookie是由Web服務器保存在用戶瀏覽器上的文本信息,它可以包含用戶和設備相關信息,每當用戶訪問Web站點時,服務器都可以訪問Cookie信息從而獲取用戶的瀏覽記錄和行為;而瀏覽器指紋是由UserAgent、字體、插件等多種瀏覽器、操作系統和設備硬件相關屬性構成,且不依賴于具體的某個特征,因此具有較好的健壯性。
針對Web追蹤帶來的隱私泄露威脅,已有學者提出相關檢測和防御方法。其中對于Cookie,用戶可以通過瀏覽器直接禁用或者定期刪除來規避;但瀏覽器指紋識別技術完全在用戶不知情下收集用戶信息,目前只能通過監視敏感JavaScript API的調用情況來完成檢測,但這種方案是基于對攻擊手段有全面了解的前提,若Web站點使用了未被發現的新屬性,就能避開這種方案。
發明內容
發明目的:針對現有技術中存在的不足,本發明充分利用Web站點的智能推薦和用戶操作的相關性,提出一種基于內容關聯的Web追蹤自動檢測方法,能夠從效果入手檢測用戶是否被追蹤。
技術方案:本發明所述的一種基于內容關聯的Web追蹤自動檢測方法,依次包含以下步驟:
1)頁面元素與用戶操作信息的收集:當用戶訪問Web站點時,通過瀏覽器擴展獲取頁面元素信息(包含所有鏈接對應的文本類描述信息、圖片鏈接URL)和用戶操作相關信息(包含輸入的搜索內容、點擊鏈接對應的文本類描述信息、點擊圖片對應的鏈接URL),并寫入文件及數據庫。
2)頁面內容關聯性的分析:頁面內容關聯包括文本關聯與圖片關聯,其中文本關聯:通過分別提取頁面元素信息與用戶操作信息中的文本類描述信息中的關鍵詞,利用文本匹配技術分析兩者關聯度;圖片關聯:通過分別下載頁面元素信息與用戶操作中的圖片,并利用圖像識別技術分析兩者關聯度。
3)自動化流程的實現:利用瀏覽器自動化測試工具啟動并配置瀏覽器,模擬用戶操作并利用腳本實現自動化流程,實現Web追蹤自動化檢測。
有益效果:與現有技術相比,本發明具有以下優點:
1、本發明從Web追蹤效果入手,通過分析用戶前后兩次訪問的Web站點的內容與用戶操作的關聯性判斷Web站點是否使用追蹤技術收集用戶信息。即使Web追蹤技術不斷更新,只要Web站點利用其推薦與用戶相關的廣告,就能被本發明檢測出來。避免了現有技術需不斷更新Web追蹤技術先驗知識的問題,結合人工代碼分析還有助于發現新型的Web追蹤技術。
2、本發明利用瀏覽器自動化測試工具以及自動化腳本將整個流程(包括啟動并配置瀏覽器、訪問Web站點、模擬用戶操作、收集頁面與用戶操作信息)自動化,實現了Web追蹤自動化檢測,無需人工參與,因此有助于進行大規模Web追蹤檢測實驗并分析真實生活中Web追蹤技術的應用情況。
附圖說明
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于東南大學,未經東南大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201711282970.5/2.html,轉載請聲明來源鉆瓜專利網。
- 內容再現系統、內容提供方法、內容再現裝置、內容提供裝置、內容再現程序和內容提供程序
- 內容記錄系統、內容記錄方法、內容記錄設備和內容接收設備
- 內容服務系統、內容服務器、內容終端及內容服務方法
- 內容分發系統、內容分發裝置、內容再生終端及內容分發方法
- 內容發布、內容獲取的方法、內容發布裝置及內容傳播系統
- 內容提供裝置、內容提供方法、內容再現裝置、內容再現方法
- 內容傳輸設備、內容傳輸方法、內容再現設備、內容再現方法、程序及內容分發系統
- 內容發送設備、內容發送方法、內容再現設備、內容再現方法、程序及內容分發系統
- 內容再現裝置、內容再現方法、內容再現程序及內容提供系統
- 內容記錄裝置、內容編輯裝置、內容再生裝置、內容記錄方法、內容編輯方法、以及內容再生方法





