[發明專利]一種數據采集方法和裝置有效
| 申請號: | 201310342198.7 | 申請日: | 2013-08-07 |
| 公開(公告)號: | CN104348656B | 公開(公告)日: | 2018-09-07 |
| 發明(設計)人: | 黃平;宮捷 | 申請(專利權)人: | 中國移動通信集團北京有限公司 |
| 主分類號: | H04L12/24 | 分類號: | H04L12/24;H04L12/823 |
| 代理公司: | 北京同達信恒知識產權代理有限公司 11291 | 代理人: | 郭潤湘 |
| 地址: | 100007 *** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 數據 采集 方法 裝置 | ||
本發明公開了一種數據采集方法和裝置,包括:采集設備從網絡節點采集經過該網絡節點傳輸的數據包;并當采集的該數據包的源地址位于丟棄地址列表中時,丟棄采集的該數據包;以及當采集的該數據包的源地址不位于丟棄地址列表中時,保留采集的該數據包,用于網絡傳輸數據的還原。采用本發明實施例提供的方案,提高了對網絡傳輸數據進行還原的效果。
技術領域
本發明涉及計算機技術領域和互聯網技術領域,尤其涉及一種數據采集方法和裝置。
背景技術
在現有互聯網技術中,經常需要對經過一些網絡節點傳輸的數據進行采集和還原,以便監控所傳輸數據的合法性。現有技術中在采集和還原經過網絡節點的網絡傳輸數據時,通常是將網絡節點的流量數據進行鏡像分流,再使用專用的采集設備將采集的數據包進行重組,還原成網絡傳輸數據,例如網站訪問數據,如網站的頁面數據和圖像數據等。
現有技術中所采集的數據包可以是IP層數據包,在還原時可以對所采集的IP層數據包進行解封裝,并將解封裝后得到的TCP(Transmission Control Protocol,傳輸控制協議)數據片段按TCP序號重組,再根據應用層協議進行內容還原,形成文件并存儲于磁盤。
目前,采集設備通常是對經過網絡節點的網絡流量數據進行全量采集,當網絡流量超過采集設備性能上限時,即超過采集設備的處理能力時,由于不能立即處理采集的數據包,會導致數據包積壓,最終使采集設備的網卡緩沖區溢出,使得采集設備自動丟棄掉部分數據包。
由于采集設備丟棄數據包是隨機的,所以對于分別表示完整會話的多組數據包,均可能存在部分數據包的丟失,再由于TCP會話重組需要依靠序列號,所以不連續的數據包將影響對完整會話的內容還原。
例如,對于頁面數據還原而言,如果數據包丟失在協議頭部,則頁面內容無法還原,而對于目前約80%網站使用的gzip壓縮格式的頁面數據,任意數據包的丟失,均將導致內容無法還原;對于圖片數據還原而言,丟包將造成壓縮圖像無法讀取、變色、破損等,還原后得到的受損圖像將對后續圖像識別產生嚴重影響。
發明內容
本發明實施例提供一種數據采集方法和裝置,用以解決現有技術中存在的對網絡傳輸數據進行還原的效果較差的問題。
本發明實施例提供一種數據采集方法,包括:
采集設備從網絡節點采集經過所述網絡節點傳輸的數據包;
當采集的所述數據包的源地址位于丟棄地址列表中時,丟棄采集的所述數據包;
當采集的所述數據包的源地址不位于丟棄地址列表中時,保留采集的所述數據包,用于網絡傳輸數據的還原。
本發明實施例提供的上述數據采集方法中,采集設備在采集到經過網絡節點傳輸的數據包之后,對于源地址位于丟棄地址列表中的數據包,進行丟棄,對于源地址不位于丟棄地址列表中的數據包,進行保留,并用于網絡傳輸數據的還原,由于表示一個完整會話的一組數據包的源地址是相同的,所以通過主動丟棄源地址位于丟棄地址列表中的一些數據包,降低了隨機丟棄源地址不位于丟棄地址列表中的一些數據包的丟棄概率,從而提高了源地址不位于丟棄地址列表中的數據包表示的網絡傳輸數據還原的成功率,進而提高了對網絡傳輸數據進行還原的效果。
進一步的,在確定采集的所述數據包的源地址是否位于丟棄地址列表中之前,還包括:
確定所述采集設備的性能參數大于第一預設參數閾值,性能參數越大表示所述采集設備的性能越差。
這樣,可以在采集設備的性能較差時,即性能參數大于第一預設參數閾值時,為了避免較高的隨機丟棄數據包的丟棄概率,從而主動丟棄源地址位于丟棄地址列表的數據包,而采集設備的性能較高時,可以不主動丟棄采集的數據包,從而能夠進一步提高對網絡傳輸數據進行還原的效果。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國移動通信集團北京有限公司,未經中國移動通信集團北京有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201310342198.7/2.html,轉載請聲明來源鉆瓜專利網。
- 數據顯示系統、數據中繼設備、數據中繼方法、數據系統、接收設備和數據讀取方法
- 數據記錄方法、數據記錄裝置、數據記錄媒體、數據重播方法和數據重播裝置
- 數據發送方法、數據發送系統、數據發送裝置以及數據結構
- 數據顯示系統、數據中繼設備、數據中繼方法及數據系統
- 數據嵌入裝置、數據嵌入方法、數據提取裝置及數據提取方法
- 數據管理裝置、數據編輯裝置、數據閱覽裝置、數據管理方法、數據編輯方法以及數據閱覽方法
- 數據發送和數據接收設備、數據發送和數據接收方法
- 數據發送裝置、數據接收裝置、數據收發系統、數據發送方法、數據接收方法和數據收發方法
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置





