[發(fā)明專利]域名過濾名單存儲、匹配方法及裝置有效
| 申請?zhí)枺?/td> | 201110193784.0 | 申請日: | 2011-07-12 |
| 公開(公告)號: | CN102882987A | 公開(公告)日: | 2013-01-16 |
| 發(fā)明(設(shè)計)人: | 鄧旻輝;羅坤莉 | 申請(專利權(quán))人: | 阿里巴巴集團控股有限公司 |
| 主分類號: | H04L29/12 | 分類號: | H04L29/12 |
| 代理公司: | 隆天國際知識產(chǎn)權(quán)代理有限公司 72003 | 代理人: | 章侃銥;張浴月 |
| 地址: | 開曼群島大開曼*** | 國省代碼: | 開曼群島;KY |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 域名 過濾 名單 存儲 匹配 方法 裝置 | ||
技術(shù)領(lǐng)域
本申請涉及網(wǎng)絡(luò)技術(shù)領(lǐng)域,尤其涉及一種基于樹的域名過濾名單(黑/白名單)存儲、匹配方法及裝置。
背景技術(shù)
域名是指由某些字符、數(shù)字和符號組成的一串標示,一個特定的域名通常可以指向Internet上的一個特定站點,各機構(gòu)、組織和公司等通常都會申請自己所需的一級域名所有權(quán)和使用權(quán),每個一級域名對應(yīng)的子域名則自動歸其擁有,而網(wǎng)絡(luò)用戶通過這些域名便可以訪問到這些機構(gòu)、公司的門戶站點。隨著當今時代網(wǎng)絡(luò)的飛速發(fā)展,Internet上日益聚集了數(shù)不勝數(shù)的站點,其中不可避免也產(chǎn)生了一些以危害用戶利益來獲利的網(wǎng)站,經(jīng)常有一些惡意網(wǎng)站的域名會出現(xiàn)在受用戶信任的安全網(wǎng)站的網(wǎng)頁或者跳轉(zhuǎn)地址中,用戶在不經(jīng)意間從安全網(wǎng)站轉(zhuǎn)而訪問到惡意網(wǎng)站的頁面,后果不堪設(shè)想,輕則使用戶獲取一些錯誤信息,重則造成經(jīng)濟損失,甚至造成難以估量的后果。因此,對提供訪問服務(wù)的網(wǎng)站運營者來說,就有責(zé)任致力于避免訪問本網(wǎng)站的用戶受到惡意網(wǎng)站的安全威脅。
具體來說,用戶一般是通過瀏覽器的方式來訪問網(wǎng)站頁面,進而通過在當前頁面點擊鏈接或者在瀏覽器地址欄輸入域名的方式來跳轉(zhuǎn)到不同的頁面,在這個過程中,有以下兩種情景特別需要引起當前網(wǎng)站運營者的注意:
(1)用戶在當前A站點(以域名a.com為例)的頁面上進行操作,比如點擊鏈接進入其他網(wǎng)站時,需要保證用戶不會通過此鏈接進入有危害性的站點;
(2)用戶通過在瀏覽器地址欄中輸入一個含有當前站點域名的URL(超鏈接),用戶進行操作后,需要保證用戶不會由此進入有危害性的站點。例如以下URL:http://a.com/1ogin.html?target=http://pianzi.com,現(xiàn)實中很多網(wǎng)站都通過這種方式來實現(xiàn)用戶登錄后直接跳轉(zhuǎn)到目標地址,用戶在進行登錄操作后,都會認為這是A站點的頁面,如果此時用戶被鏈接到一個惡意網(wǎng)站,難免不會出現(xiàn)問題。
針對上述情況,目前一般網(wǎng)站通常采取黑/白名單的策略來進行域名過濾。一般意義上的白名單通常是一些字符規(guī)則組成的列表,目標如果符合規(guī)范列表的某一條才可以獲得一些權(quán)限;黑名單則恰好相反。在計算機領(lǐng)域中,許多網(wǎng)站和軟件等都在使用過濾名單規(guī)則,如防火墻、殺毒軟件等,而具體到網(wǎng)站的域名過濾技術(shù)中,黑/白名單的策略例如可以是下述配置:(1)當前網(wǎng)站只允許跳轉(zhuǎn)或鏈接到白名單中包含的網(wǎng)站;(2)不允許跳轉(zhuǎn)或者鏈接到黑名單中包含的網(wǎng)站。
進一步,就域名黑/白名單的具體實現(xiàn)方式來說,現(xiàn)有許多網(wǎng)站都采用正則表達式的方式來進行黑/白名單的匹配,一個白名單的正則表達式配置實例包括以下步驟:
S1、首先配置一份xml格式的白名單,將所有受信任的一級域名全部配置在xml文件中;
S2、需要進行白名單匹配時,將上述的白名單全部轉(zhuǎn)化為正則表達式,然后將其存儲在內(nèi)存中;
S3、從待檢驗的URL中截取出域名,然后將域名逐個與白名單中的規(guī)則做正則表達式匹配;如果這個域名最終與其中某一條規(guī)則相匹配,表示該域名在白名單內(nèi),系統(tǒng)終止匹配,認為該URL可以訪問;如果沒有一條規(guī)則匹配,則表示該域名不在白名單內(nèi),從而不允許訪問該URL或作出警告。
黑名單的配置方式在具體實現(xiàn)上與上述白名單非常類似,因此本申請說明書中下文一律以過濾名單來泛指黑/白名單。接續(xù),上述按正則表達式實現(xiàn)的過濾名單配置方式雖然能夠保證檢查的準確性,然而也存在一定的缺陷。一方面,按條存儲的過濾名單不便于維護,而且也占用存儲空間;另一方面,正則表達式的匹配過程非常消耗資源,在遇到“.”、“*”等一些貪婪匹配符號時很容易造成大量的回溯,使檢查效率出現(xiàn)成百萬倍的下降;再一方面,正則表達式采用逐條規(guī)則匹配的方式,在面對目前網(wǎng)站內(nèi)動輒數(shù)以十億級的檢查量時往往力不從心,甚至?xí)诙虝r間內(nèi)造成服務(wù)器硬件性能的急劇降低;另外,正則表達式本身還存在不易調(diào)試、編寫困難的問題。
發(fā)明內(nèi)容
本申請的實施例旨在提供一種域名過濾名單存儲、匹配方法及裝置,以解決常用的正則表達式逐條存儲、匹配的域名過濾方式存在的上述問題。
為實現(xiàn)上述目的,根據(jù)本申請實施例的第一方面,提供了一種由計算機實現(xiàn)的域名過濾名單存儲方法,包括以下步驟:
S11.將過濾名單內(nèi)配置的域名按預(yù)定次序轉(zhuǎn)換為字符串;
S12.采用樹的方式根據(jù)所述字符串生成名單樹;
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于阿里巴巴集團控股有限公司,未經(jīng)阿里巴巴集團控股有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201110193784.0/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





