[發明專利]一種基于隱藏服務關聯的Tor核心站點發現方法在審
| 申請號: | 202210854926.1 | 申請日: | 2022-07-20 |
| 公開(公告)號: | CN115186166A | 公開(公告)日: | 2022-10-14 |
| 發明(設計)人: | 楊明;邢琳;顧曉丹;宋炳辰 | 申請(專利權)人: | 東南大學 |
| 主分類號: | G06F16/9532 | 分類號: | G06F16/9532;G06F16/955;G06F16/958;G06F21/62 |
| 代理公司: | 南京眾聯專利代理有限公司 32206 | 代理人: | 許小莉 |
| 地址: | 210096 *** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 隱藏 服務 關聯 tor 核心 站點 發現 方法 | ||
1.一種基于隱藏服務關聯的Tor核心站點發現方法,其特征在于,該方法包括如下步驟:
(1)隱藏服務關聯算法:針對內容相近但域名不同的Web站點,設計基于頁面結構和內容的隱藏服務關聯算法;
(2)計算隱藏服務存活率:通過隱藏服務的描述符是否存在來間接判定隱藏服務是否在線,并將其作為核心站點判斷的特征之一;
(3)隱藏服務訪問量測量:通過部署隱藏服務目錄服務器HSDir收集隱藏服務盲公鑰被請求的情況,進而分析比對計算隱藏服務的訪問量;
(4)Tor核心站點發現:通過(2)和(3)得到的隱藏服務存活率和訪問量對(1)中聚類的每個組中的隱藏服務進行分析,識別其中的核心站點。
2.根據權利要求1所述的一種基于隱藏服務關聯的Tor核心站點發現方法,其特征在于:所述步驟(1)具體包括:
(11)利用Response Header中的重定向鏈接進行聚類:由于一些域名訪問以后會返回301狀態碼并自動重定向到其他頁面,Response Header頭中的Location字段會顯示重定向后的頁面域名,因此將域名和重定向域名聚類成一組;
(12)將擁有有意義標題的相同站點聚成一類:定義暗網中的站點默認頁面的標題是無意義的,包括“Index of/”、“Apache2 Debian Default Page”、“401AuthorizationRequired”、Apache、Nginx,將該無意義標題以及沒有標題信息的站點各自劃為一組,而將擁有有意義標題信息且標題文字相同的站點劃分為一組;
(13)結合HTMLDOM樹、CSS樣式、頁面關鍵詞綜合進行聚類:將在有意義標題的組中抽取一個頁面,計算每個頁面的DOM樹結構、class屬性值、id屬性值以及頁面中的前20個關鍵詞信息,并用相似度算法比較每個頁面的DOM樹結構相似度、class屬性值和id屬性值相似度以及頁面關鍵詞相似度。
3.根據權利要求1所述的一種基于隱藏服務關聯的Tor核心站點發現方法,其特征在于:所述步驟(2)具體包括:
(21)從數據庫中讀取待計算隱藏服務存活率的域名;
(22)部署多個Tor進程,客戶端通過Tor控制協議向隱藏服務器發送查詢請求,實現多進程并發執行;
(23)如果描述符為非異常狀態,將根據返回信息判斷描述符是否存在進而保存結果:如果描述符存在,則認為域名在線;如果不存在,則認為域名不在線;
(24)如果描述符查詢異常且查詢次數不超過5次,則將此域名重新放入隊列中,稍后將進行重新查詢,返回步驟(22);
(25)根據返回信息,保存計算隱藏服務存活率的檢測結果。
4.根據權利要求1所述的一種基于隱藏服務關聯的Tor核心站點發現方法,其特征在于:所述步驟(3)具體包括:
(31)對每一個v3域名,計算一定周期內的全部盲公鑰;
(32)將離線計算的盲公鑰結果和從隱藏服務目錄服務器上收集到的盲公鑰數據做比對,獲得每個v3域名的總訪問量;
(33)將每個v3域名的總訪問量除以統計天數以此來計算該隱藏服務v3域名的日均訪問量。
5.根據權利要求1所述的一種基于隱藏服務關聯的Tor核心站點發現方法,其特征在于:所述步驟(4)中具體包括:
(41)對于(1)中聚類的每個組,計算每個組的存活率srj_i,其值為該組中所有域名的最大存活率;存活率srj_i如下公式表示:
其中,online_num為測量域名在線
(42)對于(1)中聚類的每個組,計算每個組的訪問量viewj_i:對于有聲明鏡像站點的網站,viewj_i為每個組的所有域名訪問量的總和;而對于沒有聲明鏡像站點的網站,viewj_i為每個組的所有域名訪問量的最大數值;
(43)將核心站點的發現問題建模為機器學習中的二分類問題,以訪問量、存活率、相似頁面數量、出入度作為分類屬性,并使用XGBoost模型進行核心站點發現;
(44)對于分類為核心站點的頁面,同時計算分類的判別概率x,基于該判別概率,進一步將認定的核心站點分為3個級別的重要程度,其中,x≥0.9的頁面將被視為最重要的核心站點,0.75≤x0.9的頁面被視為次重要的頁面,而0.5≤x0.75的頁面被視為最不重要的核心站點。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于東南大學,未經東南大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202210854926.1/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種適用于水廠的綠色無污染的強化混凝方法
- 下一篇:一種止滑鞋底及止滑鞋





