[發明專利]違法網站識別方法、裝置、電子裝置和存儲介質在審
| 申請號: | 202110986619.4 | 申請日: | 2021-08-26 |
| 公開(公告)號: | CN113779389A | 公開(公告)日: | 2021-12-10 |
| 發明(設計)人: | 汪斌;范淵;黃進 | 申請(專利權)人: | 杭州安恒信息技術股份有限公司 |
| 主分類號: | G06F16/9535 | 分類號: | G06F16/9535;G06F16/958;H04L29/12 |
| 代理公司: | 杭州華進聯浙知識產權代理有限公司 33250 | 代理人: | 聶磊 |
| 地址: | 310051 浙江省*** | 國省代碼: | 浙江;33 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 違法 網站 識別 方法 裝置 電子 存儲 介質 | ||
本申請涉及一種違法網站識別方法、裝置、電子裝置和存儲介質,其中,該違法網站識別方法包括:獲取違法域名集和合法域名集,其中,所述違法域名集包括多個違法域名,所述合法域名集包括多個合法域名;根據所述違法域名集和所述合法域名集,獲取違法域名信息集和合法域名信息集;根據所述違法域名信息集和合法域名信息集進行匹配,生成域名關聯集;根據所述域名關聯集,建立違法域名樹。通過本申請,解決了無法即時準確的識別違法網站的問題,實現了加快基于關聯域名的違法域名信息的搜索速度和提高基于關聯域名的違法域名信息搜索的準確性、擴充搜索范圍等,可用于高效地、準確地、大規模地識別違法網站。
技術領域
本申請涉及互聯網信息安全領域,特別是涉及違法網站識別方法、裝置、電子裝置和存儲介質。
背景技術
隨著近年來互聯網產業的飛速發展,互聯網的服務模式和傳播渠道也日趨多樣化。新聞網站、門戶網站、搜索引擎、論壇、博客、P2P等多種服務模式并存,互聯網已演化成為一個虛擬社會,互聯網安全管理面臨空前的挑戰。
互聯網信息技術的不斷進步,不僅給互聯網用戶提供便利,也使計算機信息領域的犯罪越來越多,對國家和個人造成了越來越大的影響。如何高效、準確識別違法網站已成為一個至關重要的關鍵點。
目前,政府部門或第三方廠商往往會設置相應的舉報途徑,接收來自互聯網用戶的舉報信息,對舉報信息進行核實,再對違法網站、違禁內容進行查封,以實現對互聯網內容的監督。但是,大多數互聯網用戶缺乏一定的鑒別能力,往往只有在上當受騙后,才能進行舉報,甚至在不知情的情況下,根本不會進行舉報。
然而,在大量的網站面前如果通過人工進行審核,很難在短時間內通過人工識別出違法網站。因此,在人力有限的情況下,利用先進的計算機信息安全技術對網站進行準確的識別已成為亟待解決的問題。
針對相關技術中存在無法即時準確的識別違法網站,目前還沒有提出有效的解決方案。
發明內容
在本實施例中提供了一種違法網站識別方法、裝置、電子裝置和存儲介質,以解決相關技術中存在無法即時準確的識別違法網站的問題。
第一個方面,在本實施例中提供了一種違法網站識別方法,包括:
獲取違法域名集和合法域名集,其中,所述違法域名集包括多個違法域名,所述合法域名集包括多個合法域名;
根據所述違法域名集和所述合法域名集,獲取違法域名信息集和合法域名信息集;
根據所述違法域名信息集和合法域名信息集進行匹配,生成域名關聯集;
根據所述域名關聯集,建立違法域名樹。
在其中的一些實施例中,所述根據所述合法域名信息集和違法域名信息集,生成域名關聯集包括:
其中,所述違法域名信息集包括多個違法域名信息,所述合法域名信息集包括多個合法域名信息;
將所述違法域名信息和多個所述合法域名信息進行廣度優先搜索,獲得關聯路徑;
根據所述關聯路徑,生成域名關聯集。
在其中的一些實施例中,所述將所述違法域名信息和多個所述合法域名信息進行廣度優先搜索,獲得關聯路徑包括:
將所述違法域名信息集內的違法域名信息逐一與所述合法域名信息集內的合法域名信息進行匹配,獲得對應的關聯域名;
根據多個所述關聯域名,生成關聯路徑。
在其中的一些實施例中,所述將所述違法域名信息集內的違法域名信息逐一與所述合法域名信息集內的合法域名信息進行匹配,獲得對應的關聯域名包括:
檢測所述違法域名信息與所述合法域名信息的相似度是否大于關聯閾值;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于杭州安恒信息技術股份有限公司,未經杭州安恒信息技術股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110986619.4/2.html,轉載請聲明來源鉆瓜專利網。





