[發明專利]一種識別URL的方法和裝置在審
| 申請號: | 201810517613.0 | 申請日: | 2018-05-25 |
| 公開(公告)號: | CN110535815A | 公開(公告)日: | 2019-12-03 |
| 發明(設計)人: | 王建明;曹志文 | 申請(專利權)人: | 網宿科技股份有限公司 |
| 主分類號: | H04L29/06 | 分類號: | H04L29/06 |
| 代理公司: | 11573 北京華智則銘知識產權代理有限公司 | 代理人: | 陳向敏<國際申請>=<國際公布>=<進入 |
| 地址: | 200030 上海市徐匯區*** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 預設 屬性信息 網頁內容 惡意URL 匹配度 方法和裝置 互聯網安全 備案狀態 訪問請求 屬性標準 識別率 歸屬 記錄 | ||
1.一種識別URL的方法,其特征在于,所述方法包括:
當接收到對于未識別URL的訪問請求時,記錄所述未識別URL為可疑URL;
判斷所述可疑URL的屬性信息是否符合預設的正常URL屬性標準,其中,所述屬性信息至少包括備案狀態或歸屬者信息中的一項;
如果符合,則標記所述可疑URL為正常URL,否則根據預設的惡意詞名單計算所述可疑URL對應的網頁內容的惡意匹配度;
如果所述網頁內容的惡意匹配度大于預設閾值,則標記所述可疑URL為惡意URL。
2.根據權利要求1所述的方法,其特征在于,所述當接收到對于未識別URL的訪問請求時,記錄所述未識別URL為可疑URL之前,還包括:
接收目標URL的訪問請求,判斷所述目標URL是否存在于URL黑名單;
如果存在,則標記所述目標URL為惡意URL,否則判斷所述目標URL是否存在于URL白名單;
如果存在,則標記所述目標URL為正常URL,否則標記所述目標URL為未識別URL。
3.根據權利要求1所述的方法,其特征在于,所述屬性信息還包括存在時長或訪問量中的至少一項;
所述判斷所述可疑URL的屬性信息是否符合預設的正常URL屬性標準,包括:
判斷備案網站是否記錄有所述可疑URL的備案信息,如果是,則判斷所述可疑URL的屬性信息符合預設的正常URL屬性標準;
和/或,判斷是否查詢到所述可疑URL的歸屬者信息,如果是,則判斷所述可疑URL的屬性信息符合預設的正常URL屬性標準;
和/或,判斷所述可疑URL的存在時長是否大于預設存在時長且小于有效存在時長;
和/或,判斷所述可疑URL的訪問量是否大于預設訪問量。
4.根據權利要求1所述的方法,其特征在于,所述屬性信息還包括存在時長或訪問量中的至少一項;
所述判斷所述可疑URL的屬性信息是否符合預設的正常URL屬性標準,包括:
判斷備案網站是否記錄有所述可疑URL的備案信息;
如果是,則判斷所述可疑URL的屬性信息符合預設的正常URL屬性標準,否則,判斷所述可疑URL的存在時長是否大于預設存在時長且小于有效存在時長;
如果是,則判斷所述可疑URL的屬性信息符合預設的正常URL屬性標準,否則,判斷所述可疑URL的訪問量是否大于預設訪問量;
如果是,則判斷所述可疑URL的屬性信息符合預設的正常URL屬性標準,否則,判斷是否查詢到所述可疑URL的歸屬者信息,如果是,則判斷所述可疑URL的屬性信息符合預設的正常URL屬性標準。
5.根據權利要求1所述的方法,其特征在于,所述根據預設的惡意詞名單計算所述可疑URL對應的網頁內容的惡意匹配度,包括:
將所述可疑URL對應的網頁內容轉換為文本串;
根據低空間損耗的字符串匹配算法和所述預設的惡意詞名單,對所述文本串進行惡意詞匹配,確定所述惡意詞名單中每個惡意詞的出現次數;
根據所述惡意詞名單中每個惡意詞的出現次數及每個惡意詞的預設權值,計算所述可疑URL對應的網頁內容的惡意匹配度。
6.根據權利要求1所述的方法,其特征在于,所述標記所述可疑URL為正常URL之后,還包括:
將所述可疑URL更新到所述URL白名單;
所述標記所述可疑URL為惡意URL之后,還包括:
將所述可疑URL更新到所述URL黑名單。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于網宿科技股份有限公司,未經網宿科技股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810517613.0/1.html,轉載請聲明來源鉆瓜專利網。





