[發明專利]用于URL分析系統的文件擴展名快速匹配方法和裝置有效
| 申請號: | 201810288551.0 | 申請日: | 2018-04-03 |
| 公開(公告)號: | CN108549679B | 公開(公告)日: | 2022-03-25 |
| 發明(設計)人: | 畢慧;李超;陳思;朱緩;劉剛;李占玉 | 申請(專利權)人: | 國家計算機網絡與信息安全管理中心;深圳市任子行科技開發有限公司 |
| 主分類號: | G06F16/955 | 分類號: | G06F16/955;G06F16/9535;G06F16/903;G06F16/901 |
| 代理公司: | 深圳市順天達專利商標代理有限公司 44217 | 代理人: | 郭偉剛 |
| 地址: | 100029*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 用于 url 分析 系統 文件 擴展名 快速 匹配 方法 裝置 | ||
1.一種用于URL分析系統的文件擴展名快速匹配方法,其特征在于,所述方法包括:
根據用戶的業務需求,接收所需過濾URL的文件擴展名信息;
利用接收到的所需過濾URL的文件擴展名信息,構建快速匹配算法環境,所述快速匹配算法環境利用字節對文件擴展名字符串中的字符進行順序標記,并采用字典樹儲存方式來依次儲存文件擴展名的字符串;
利用構建的快速匹配算法環境,對待檢測URL的文件擴展名進行匹配,過濾掉不符合用戶業務需求的URL;
所述的利用接收到的所需過濾URL的文件擴展名信息,構建快速匹配算法環境包括:
利用預設的數組對文件擴展名所需的所有字符按照預設順序進行標記,形成相應的字符索引表,每個所述數組由預設數量的字節構成,每個所述數組中位的總數與所有字符的總數的差值大于等于0且小于8;
構建具有多層的樹形儲存結構,所述樹形儲存結構中每個節點由一個數組構成且用于標記一個字符,每層中節點的數量是其相鄰上層中節點數量乘以所有字符的總數;
對于每個所需過濾文件的擴展名對應的字符串,進行倒序遍歷;
采用字典樹儲存方式,將所需過濾文件的擴展名對應的字符串按照倒序儲存在樹形儲存結構中,形成快速匹配算法環境。
2.根據權利要求1所述的文件擴展名快速匹配方法,其特征在于,在所述快速匹配算法環境中,倒序儲存的字符串里相鄰字符在數組中的位置關系按照如下公式關系進行索引:
Qn+1=N1*(Qn*N2+Ln);
其中,N1為構成一個數組的字節總數,N2為所有字符的總數,Qn+1為第一字符在樹形儲存結構中所處的字節位置值,Qn為第二字符在樹形儲存結構中所處的字節位置值,Ln為第二字符在字符索引表中的索引值,所述第一字符與所述第二字符在倒序儲存的字符串中相鄰,并且所述第二字符為所述第一字符的前一個字符。
3.根據權利要求2所述的文件擴展名快速匹配方法,其特征在于,所述利用構建的快速匹配算法環境,對待檢測URL的文件擴展名進行匹配,過濾掉不符合用戶業務需求的URL,包括:
將待檢測的URL的文件擴展名對應的字符串按照倒序方式,在所述快速匹配算法環境中進行逐字符匹配;
如果匹配成功,則過濾掉匹配成功的待檢測URL。
4.一種用于URL分析系統的文件擴展名快速匹配裝置,其特征在于,包括:
接收模塊,用于根據用戶的業務需求,接收所需過濾URL的文件擴展名信息;
構建模塊,用于利用接收到的所需過濾URL的文件擴展名信息,構建快速匹配算法環境,所述快速匹配算法環境利用字節對文件擴展名字符串中的字符進行順序標記,并采用字典樹儲存方式來依次儲存文件擴展名的字符串;
匹配模塊,用于利用構建的快速匹配算法環境,對待檢測URL的文件擴展名進行匹配,過濾掉不符合用戶業務需求的URL;
所述構建模塊包括:
標記單元,用于利用預設的數組對文件擴展名所需的所有字符按照預設順序進行標記,形成相應的字符索引表,每個所述數組由預設數量的字節構成,每個所述數組中位的總數與所有字符的總數的差值大于等于0且小于8;
構建單元,用于構建具有多層的樹形儲存結構,所述樹形儲存結構中每個節點由一個數組構成且用于標記一個字符,每層中節點的數量是其相鄰上層中節點數量乘以所有字符的總數;
處理單元,用于對于每個所需過濾文件的擴展名對應的字符串,進行倒序遍歷;
儲存單元,用于采用字典樹儲存方式,將所需過濾文件的擴展名對應的字符串按照倒序儲存在樹形儲存結構中,形成快速匹配算法環境。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于國家計算機網絡與信息安全管理中心;深圳市任子行科技開發有限公司,未經國家計算機網絡與信息安全管理中心;深圳市任子行科技開發有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810288551.0/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:信息采集系統
- 下一篇:一種針對半結構化大數據的空間數據分析方法





