[發明專利]一種采集種子文件的方法、設備及系統有效
| 申請號: | 201210084450.4 | 申請日: | 2012-03-27 |
| 公開(公告)號: | CN102638577A | 公開(公告)日: | 2012-08-15 |
| 發明(設計)人: | 孫昌瑞;何佳誠;陳奇;李健松;宗劼 | 申請(專利權)人: | 北京藍汛通信技術有限責任公司 |
| 主分類號: | H04L29/08 | 分類號: | H04L29/08 |
| 代理公司: | 北京同達信恒知識產權代理有限公司 11291 | 代理人: | 黃志華 |
| 地址: | 100016 北京市朝*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 采集 種子 文件 方法 設備 系統 | ||
技術領域
本發明涉及網絡技術領域,尤其涉及一種采集種子文件的方法、設備及裝置。
背景技術
在點對點網絡(peer?to?peer,P2P)中,進行種子文件(BitTorrent,俗稱BT)采集的方法有多種,其中最主要的兩種方法為采用爬蟲程序采集種子文件和采用數據包劫持的方式采集種子文件。種子文件又稱元原文件(或metafile),在種子文件中保存有共享文件的信息,如共享文件的文件名稱、文件大小、劫持服務器(Tracker)地址等,一般以“.torrent”為后綴。
爬蟲程序是自動提取網絡的程序,一般為搜索引擎的重要組成部分,爬蟲程序首先需要根據一定的網頁分析算法過濾與主題無關的鏈接,保留有用的鏈接并將其放入等待抓取的URL(統一資源定位符)隊列,然后根據一定的搜索策略從隊列中選擇下一步要抓取網頁的URL地址,重復該過程直至達到一定的條件。由此可見,爬蟲程序是通過無限訪問去爬各個網站(如BT論壇等)以獲取種子文件,這就需要花費大量的時間,實時性較低。
并且,爬蟲程序首先要確定爬取的網站的URL,這就使得爬蟲程序不可能爬取所有產生種子文件的網站。爬蟲程序采用無限訪問的方式對網站的危害也較大,必須設置一定的時間間隔策略,延時抓取,這就會降低種子文件采集的速率,同時,在從網站中爬取種子文件時,一般都需要在該網站爬取3-7層才能到找到種子文件,這又進一步降低了采集速率,降低了實時性。
數據包劫持的方式主要是通過劫持客戶端發送數據包,分析數據包內容,再根據分析結果采集種子文件。該方式對服務器的要求較高,并且需要進行流量牽引。由此可見,數據包劫持的方式針對性較差,并且采集僅限于能夠劫持到數據包的范圍之內,采集種子文件的范圍有限,采集實時性較差。
發明內容
本發明提供一種采集種子文件的方法、設備及系統,用以提高采集種子文件的針對性,提高采集種子文件的實時性。
本發明實施例提供的具體技術方案如下:
一種采集種子文件的方法,包括:
采集服務器從中央服務器獲取磁力鏈接,所述磁力鏈接為所述中央服務器接收至少一個客戶端發送的資源請求后生成,所述磁力鏈接至少包括請求資源的哈希值和所述資源請求攜帶的Tracker服務器地址;
采集服務器根據所述磁力鏈接中包含的所述哈希值確定下載同一資源的對端客戶端,并從所述對端客戶端獲取所述請求資源的分片信息,生成種子文件。
一種采集服務器,包括:
獲取單元,用于從中央服務器獲取磁力鏈接,所述磁力鏈接為所述中央服務器接收至少一個客戶端發送的資源請求后生成,所述磁力鏈接至少包括請求資源的哈希值和所述資源請求攜帶的Tracker服務器地址;
處理單元,用于根據所述磁力鏈接中包含的所述哈希值確定下載同一資源的對端客戶端,并從所述對端客戶端地址獲取所述請求資源的分片信息,生成種子文件。
一種采集種子文件的系統,包括:
至少一個請求客戶端,用于發送資源請求,所述資源請求中至少包括請求資源的哈希值和Tracker服務器地址;
中央服務器,用于接收所述至少一個請求客戶端發送的所述資源請求,并根據所述資源請求中包含的所述請求資源的哈希值以及所述Tracker服務器地址生成磁力鏈接,所述磁力鏈接中至少包括所述請求資源的哈希值和相應的Tracker服務器地址;
采集服務器,用于從所述中央服務器獲取所述磁力鏈接,根據所述磁力鏈接中包含的所述哈希值確定下載同一資源的對端客戶端,并從所述對端客戶端獲取所述請求資源的分片信息,生成種子文件;
至少一個對端客戶端,用于為所述采集服務器提供所述資源分片信息。
基于上述技術方案,本發明實施例中,中央服務器接收至少一個客戶端發送的資源請求后生成磁力鏈接,該磁力鏈接中至少包括請求資源的哈希值和資源請求攜帶的Tracker服務器地址,采集服務器從中央服務器獲取該磁力鏈接后,根據該磁力鏈接中包含的哈希值確定下載同一資源的對端客戶端,并從該對端客戶端獲取請求資源的分片信息,生成種子文件,從而使得采集服務器能夠根據實時生成的磁力鏈接獲取資源的分片信息,并生成種子文件,提高了采集的種子文件的實時性,同時,根據哈希值確定下載同一資源的對端客戶端,提高了采集的種子文件的針對性。
附圖說明
圖1為本發明實施例中采集種子文件的系統架構示意圖;
圖2為本發明實施例中采集服務器的結構示意圖;
圖3為本發明實施例中采集種子文件的方法流程圖;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京藍汛通信技術有限責任公司,未經北京藍汛通信技術有限責任公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201210084450.4/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種散熱結構
- 下一篇:一種JFET器件及其形成方法





