[發明專利]一種基于多維度分析的數據篡改監測和識別方法、裝置、電子設備及其存儲介質有效
| 申請號: | 202010908124.5 | 申請日: | 2020-09-02 |
| 公開(公告)號: | CN111967063B | 公開(公告)日: | 2021-04-09 |
| 發明(設計)人: | 汪敏;嚴妍;肖國泉;裴非;肖克;彭祖劍;邵羅樹;尹娜 | 申請(專利權)人: | 開普云信息科技股份有限公司;北京開普云信息科技有限公司 |
| 主分類號: | G06F21/64 | 分類號: | G06F21/64;G06F16/951;G06F16/958;G06K9/62;G06F40/279 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 523000 廣東省東莞市石龍鎮中*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 多維 分析 數據 篡改 監測 識別 方法 裝置 電子設備 及其 存儲 介質 | ||
本發明提供了一種基于多維度分析的數據篡改監測和識別方法、裝置、電子設備及其存儲介質,屬于互聯網內容安全監測技術領域。所述方法應用于服務器,從網頁中抽取網頁特征,通過分類算法構建篡改二分類模型,利用fasttext算法對模型進行機器學習分類訓練,并通過DNS分析、網頁結構分析、暗鏈/外鏈分析、詞庫/規則匹配分析多個維度進行監測,對模型訓練數據和各維度監測數據進行綜合評分,最終得到監測結果。本技術方案將DNS分析、網頁結構分析、暗鏈/外鏈分析、詞庫/規則匹配分析、篡改二分類模型分析技術相融合,相比傳統僅采用一項分析技術的監測方法而言,從多個維度、多個特質綜合多項分析技術進行監測和統一分析,能有效減少誤報、漏報情況;并且,通過制定和采用一定規則,同時實施多項分析技術,將近時間內分析結果存入緩存中,能有效避免重復計算,高并發處理海量網頁,使處理速度遠高于常規監測手段。
技術領域
本發明涉及互聯網內容安全監測技術領域,尤其涉及一種基于多維度分析的數據篡改監測和識別方法、裝置、電子設備及其存儲介質。
背景技術
隨著互聯網和網絡應用的普及與發展,大量的黑客攻擊隨之而來,特別是針對互聯網的網絡攻擊。網頁篡改是目前較為普遍的一類網站攻擊形式,它是指黑客利用特定手段入侵網站,將網站內容部分或完全替代。
據統計,在政府網站中,有大量網站被篡改,特別是已關停的網站,絕大部分已關停網站被篡改成黃賭毒網站。頁面被篡改不僅導致正常的業務無法運營,更損害了政府或公共機構的形象,有些站點甚至被間接利用,成為非法牟利的工具。
當前,互聯網網頁篡改監測是熱門研究方向。傳統方式是局部變化性的網頁篡改識別,基于詞庫規則的方式,但是這些處理方式存在一些問題,比如需要大量人力維護詞庫,漏報嚴重,數據結構復雜,執行時間速度慢等特點。另外,單純依賴一種經典算法或處理方式,缺乏良好的預處理和事后信息過濾等手段時,易造成誤報率較高,導致系統實用性差。在目前形勢下,政府對全互聯網監控提出了更高的要求,傳統的網頁篡改算法,不管從準確度還是處理速度,都難以滿足現實應用的需求。
發明內容
本發明為了彌補現有技術的不足,提供一種基于多維度分析的數據篡改監測和識別方法、裝置、電子設備及其存儲介質,該技術主要解決在海量網頁實時過濾的高并發問題,解決機械匹配,單一處理方式產生的高誤報、高漏報問題。
網頁篡改通常有以下現象:
1、頁面全部篡改:整個頁面都是黃色或賭博網頁;
2、頁面局部篡改:用戶瀏覽網頁時看到的還是正常網站,但實際頁面中插入了惡意地址,主要表現為:title/meta這類標簽中包含有惡意文字,或網站內部有大量的暗鏈;
3、網頁打不開;
4、頁面反復跳轉的情況。
綜合上述現象,本發明提供了一種基于多維度分析的數據篡改監測和識別方法,實現原理是:
系統通過從DNS分析、網頁結構分析、暗鏈/外鏈分析、詞庫/規則匹配分析、篡改二分類模型分析多個維度對頁面是否篡改進行監測,并通過統一打分機制對監測結果進行統計,最后將安全評審結果存放在緩存中。本技術方案可以有效減少誤報、漏報情況,在處理速度上快于常規監測手段,能避免重復計算,解決高并發問題。
本發明的實施例是這樣實現的:
第一方面,本發明實施例提供了一種基于多維度分析的數據篡改監測和識別方法,應用于服務器,實現步驟如下:
從網頁中抽取網頁特征,通過分類算法構建篡改二分類模型,利用fasttext算法對模型進行機器學習分類訓練,并通過DNS分析、網頁結構分析、暗鏈/外鏈分析、詞庫/規則匹配分析多個維度進行監測,對模型訓練數據和各維度監測數據進行綜合評分,最終得到監測結果。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于開普云信息科技股份有限公司;北京開普云信息科技有限公司,未經開普云信息科技股份有限公司;北京開普云信息科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010908124.5/2.html,轉載請聲明來源鉆瓜專利網。
- 數據顯示系統、數據中繼設備、數據中繼方法、數據系統、接收設備和數據讀取方法
- 數據記錄方法、數據記錄裝置、數據記錄媒體、數據重播方法和數據重播裝置
- 數據發送方法、數據發送系統、數據發送裝置以及數據結構
- 數據顯示系統、數據中繼設備、數據中繼方法及數據系統
- 數據嵌入裝置、數據嵌入方法、數據提取裝置及數據提取方法
- 數據管理裝置、數據編輯裝置、數據閱覽裝置、數據管理方法、數據編輯方法以及數據閱覽方法
- 數據發送和數據接收設備、數據發送和數據接收方法
- 數據發送裝置、數據接收裝置、數據收發系統、數據發送方法、數據接收方法和數據收發方法
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置





