[發明專利]基于二進制編碼的DNS數據壓縮、解壓縮方法及系統有效
| 申請號: | 201210333176.X | 申請日: | 2012-09-07 |
| 公開(公告)號: | CN103685589B | 公開(公告)日: | 2017-01-25 |
| 發明(設計)人: | 陽任科 | 申請(專利權)人: | 中國科學院計算機網絡信息中心 |
| 主分類號: | H04L29/12 | 分類號: | H04L29/12;H04L29/06;G06F17/30 |
| 代理公司: | 北京君尚知識產權代理事務所(普通合伙)11200 | 代理人: | 余長江 |
| 地址: | 100190 *** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 二進制 編碼 dns 數據壓縮 解壓縮 方法 系統 | ||
1.一種基于二進制編碼的DNS數據壓縮方法,其步驟為:
1)數據讀取模塊從DNS數據源文件中讀取日志信息后,將數據打包放到一緩存隊列中;
2)數據壓縮模塊從該數據緩存隊列中取出數據并壓縮后,將其存儲到一壓縮信息緩存中;
3)二進制編碼模塊從該壓縮信息緩存中取出數據并進行二進制編碼后保存到一結果文件中。
2.如權利要求1所述的方法,其特征在于采用可變長度整型編碼規則進行所述二進制編碼;所述可變長度整型編碼的最大長度為128字節。
3.如權利要求2所述的方法,其特征在于二進制編碼后的每個數據域包括標志字段和數據字段兩部分;其中,標志字段用于指明數據的類型和數據在消息結構體中的序號,數據字段用于存儲數據的值;一個DNS數據包二進制編碼后對應一個消息結構體。
4.如權利要求1所述的方法,其特征在于所述數據壓縮模塊對日志信息中的時間數據信息進行壓縮,其方法為:首先從所述緩存隊列中讀取一條記錄,如果是首條記錄則保留該記錄完整的時間格式;否則判斷當前記錄的在設定級時間域及其上級時間域的時間與上一條記錄的對應級時間域是否相等,如果相等,則只保留設定級時間域下一級時間的時間;如果不相等,則判斷當前記錄時間與上一記錄時間間隔是否大于設定閾值,如果大于該閾值,則保留當前記錄完整的時間格式,否則比較設定級時間域下一級時間的時間,如果當前記錄設定級時間域下一級時間小于上一條記錄對應時間,則只保留當前記錄設定級時間域的下一級時間域的時間,否則保留當前記錄完整的時間格式。
5.如權利要求1所述的方法,其特征在于所述數據壓縮模塊對日志信息中的域名數據和IP數據信息進行壓縮;a)對于域名數據進行壓縮的方法為:從所述緩存隊列中讀取一條記錄,在所述哈希鏈表中搜索該記錄中的域名;如果存在該域名,則將該域名在哈希鏈表中的哈希位置保存到所述結果文件中,如果不存在該域名,則在所述哈希鏈表中為該域名構建結點并將該域名保存到所述結果文件中;b)對于IP地址數據信息進行壓縮的方法為:從所述緩存隊列中讀取一條記錄,在所述哈希鏈表中搜索該記錄中的IP地址;如果存在該IP,則將該IP在哈希鏈表中的哈希位置保存到所述結果文件中,如果不存在該IP,則在所述哈希鏈表中為該IP構建結點并將該IP保存到所述結果文件中。
6.一種基于二進制編碼的DNS數據壓縮文件的解壓縮方法,其步驟為:
1)二進制解碼模塊將結果文件中二進制編碼壓縮日志信息進行二進制編碼解壓后,保存到壓縮信息緩存中;
2)數據解壓模塊從壓縮信息緩存中取出數據,將其存儲到一解壓信息緩存中;
3)數據解壓模塊從該解壓信息緩存中取出數據并進行解壓得到日志記錄信息。
7.如權利要求6所述的方法,其特征在于所述數據解壓模塊從該解壓信息緩存中取出數據,對時間數據進行解壓,其方法為:首先從所述解壓信息緩存中讀取一條記錄,如果是完整的時間格式,則將其設為基準時間;否則判斷當前記錄的時間域的時間是否大于或等于上一條記錄的對應時間域的時間,如果是,則利用上一條記錄的完整格式時間和當前記錄的時間域的時間合成當前記錄的完整時間格式;如果小于,則利用上一條記錄的完整格式時間將當前記錄的時間域的上一級時間域加1并判斷上一級時間域是否需要進制,如需要進制則利用上一條記錄的完整格式時間進行調整并繼續逐級判斷是否需要進制,合成當前記錄的完整時間格式;如果不需要進制,則利用上一條記錄的完整格式時間和當前記錄的時間域的時間合成當前記錄的完整時間格式;其中,所述時間域為微秒時間域。
8.如權利要求6所述的方法,其特征在于所述數據解壓模塊從該解壓信息緩存中取出數據,對域名數據和IP數據進行解壓;a)對于域名數據,其解壓方法為:從所述解壓信息緩存中讀取一條記錄,如果域名為完整格式,則將其加入到哈希鏈表中并返回;如果域名信息為所述哈希鏈表中的位置信息,則根據該位置信息從所述哈希鏈表相應位置處讀出域名的完整格式,并返回;b)對于IP數據,其解壓方法為:從所述解壓信息緩存中讀取一條記錄,如果IP為完整格式,則將其加入到哈希鏈表中并返回;如果IP信息為所述哈希鏈表中的位置信息,則根據該位置信息從所述哈希鏈表相應位置處讀出IP的完整格式,并返回。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國科學院計算機網絡信息中心,未經中國科學院計算機網絡信息中心許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201210333176.X/1.html,轉載請聲明來源鉆瓜專利網。





