[發(fā)明專利]一種網(wǎng)頁篡改的檢測方法及裝置有效
| 申請?zhí)枺?/td> | 201611207732.3 | 申請日: | 2016-12-23 |
| 公開(公告)號: | CN106778357B | 公開(公告)日: | 2020-02-07 |
| 發(fā)明(設計)人: | 古琳瑩;吳昊;張楠;張維 | 申請(專利權(quán))人: | 北京神州綠盟信息安全科技股份有限公司;北京神州綠盟科技有限公司 |
| 主分類號: | G06F21/64 | 分類號: | G06F21/64;G06K9/62;G06F16/958;G06F16/33 |
| 代理公司: | 11291 北京同達信恒知識產(chǎn)權(quán)代理有限公司 | 代理人: | 黃志華 |
| 地址: | 100089 北京*** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 網(wǎng)頁 篡改 檢測 方法 裝置 | ||
本發(fā)明公開了一種網(wǎng)頁篡改的檢測方法及裝置,用以解決現(xiàn)有技術(shù)中存在計算量大、檢測效率低的問題。該方法為:確定到達預設的檢測周期的情況下,對待檢測網(wǎng)頁進行分詞處理,獲取待檢測網(wǎng)頁對應的特征詞集合,并基于特征詞集合,獲取待檢測網(wǎng)頁對應的特征向量;將特征向量輸入預先建立的網(wǎng)頁特征預測模型,獲取待檢測網(wǎng)頁對應的隸屬度集合;計算特征詞相似度以及隸屬度集合;基于特征詞相似度和隸屬度相似度,判斷待檢測網(wǎng)頁是否被篡改。這樣,無需將整篇待檢測網(wǎng)頁與基準網(wǎng)頁進行比對分析,即可實現(xiàn)網(wǎng)頁篡改的檢測,有效地降低了網(wǎng)頁篡改檢測的計算量,提高了網(wǎng)頁篡改檢測的效率。
技術(shù)領(lǐng)域
本發(fā)明涉及網(wǎng)絡安全技術(shù)領(lǐng)域,尤其涉及一種網(wǎng)頁篡改的檢測方法及裝置。
背景技術(shù)
隨著網(wǎng)絡技術(shù)的不斷發(fā)展,各大類型的網(wǎng)站應運而生,比如:新聞類網(wǎng)站,體育類網(wǎng)站,科技類網(wǎng)站,購物類網(wǎng)站,以及企業(yè)運營類網(wǎng)站等等,這不僅豐富了用戶的業(yè)余生活,也實現(xiàn)了產(chǎn)品、信息、企業(yè)等的宣傳和推廣。但是,人們在享受網(wǎng)絡帶來的便利的同時,也面臨著網(wǎng)絡帶來的安全隱患,在實際應用中,網(wǎng)頁篡改事件時有發(fā)生,這不僅會影響網(wǎng)站所有者的對外形象,還會造成網(wǎng)站所有者和網(wǎng)站瀏覽者的財產(chǎn)損失。
目前,針對網(wǎng)頁篡改,主要提出了如下檢測方案:通過數(shù)字水印技術(shù),在網(wǎng)頁中嵌入篡改檢測腳本,以及與基準網(wǎng)頁(即原始網(wǎng)頁)進行對比分析等方式,實現(xiàn)網(wǎng)頁篡改的檢測和防護;或者,在網(wǎng)站服務器和用戶設備之間部署網(wǎng)站應用防護(Web ApplicationFirewall,WAF)設備,實現(xiàn)網(wǎng)頁篡改的檢測和防護。
基于上述分析,現(xiàn)有技術(shù)中,大多數(shù)的網(wǎng)頁篡改的檢測方法均需要將待檢測網(wǎng)頁與基準網(wǎng)頁進行比對分析,以確定待檢測網(wǎng)頁是否被篡改,不僅計算量較大,檢測效率較低,而且,還存在由于無法準確獲知基準網(wǎng)頁是否已更新,導致網(wǎng)頁篡改檢測不準確的問題。除此之外,通過數(shù)字水印技術(shù)等對網(wǎng)頁進行檢測,需要修改網(wǎng)站服務器本身的代碼,操作比較復雜。而且,在對網(wǎng)頁進行檢測的過程中,在網(wǎng)站服務器與用戶客戶端之間進行數(shù)據(jù)傳輸時,還需要增加防護措施,檢測成本較高。
發(fā)明內(nèi)容
本發(fā)明實施例提供了一種網(wǎng)頁篡改的檢測方法及裝置,用以解決現(xiàn)有技術(shù)中在檢測網(wǎng)頁篡改時存在計算量較大,檢測效率較低,以及檢測成本較高的問題。
本發(fā)明實施例提供的具體技術(shù)方案如下:
一種網(wǎng)頁篡改的檢測方法,包括:
確定到達預設的檢測周期的情況下,提取待檢測網(wǎng)頁的特征詞,獲取待檢測網(wǎng)頁對應的目標特征詞集合,并基于目標特征詞集合,獲取待檢測網(wǎng)頁對應的特征向量;
將特征向量輸入預先建立的網(wǎng)頁特征預測模型,獲取待檢測網(wǎng)頁對應的隸屬度集合,其中,隸屬度集合是待檢測網(wǎng)頁在各個網(wǎng)頁類別下分別對應的隸屬度的集合;
計算目標特征詞集合與在上一檢測周期中獲取到的基準特征詞集合之間的特征詞相似度以及隸屬度集合與在上一檢測周期中獲取到的基準隸屬度集合之間的隸屬度相似度,并基于特征詞相似度和隸屬度相似度,判斷待檢測網(wǎng)頁是否被篡改。
較佳的,網(wǎng)頁特征預測模型是采用以下方式建立的:
針對采集到的各個網(wǎng)頁類別下的每一個樣本網(wǎng)頁進行分詞處理,獲取各個網(wǎng)頁類別下的每一個樣本網(wǎng)頁分別對應的樣本特征詞集合;
對各個網(wǎng)頁類別下的每一個樣本網(wǎng)頁分別對應的樣本特征詞集合進行約減處理,獲取各個網(wǎng)頁類別下的每一個樣本網(wǎng)頁分別對應的訓練樣本特征詞集合;
對各個網(wǎng)頁類別下的每一個樣本網(wǎng)頁分別對應的訓練樣本特征詞集合進行歸一化處理,獲取各個網(wǎng)頁類別下的每一個樣本網(wǎng)頁分別對應的樣本特征向量;
對各個網(wǎng)頁類別下的每一個樣本網(wǎng)頁分別對應的樣本特征向量進行網(wǎng)頁分類訓練,獲取用于確定待檢測網(wǎng)頁對應的隸屬度集合的網(wǎng)頁分類函數(shù),并將網(wǎng)頁分類函數(shù)作為處理函數(shù),建立網(wǎng)頁特征預測模型。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于北京神州綠盟信息安全科技股份有限公司;北京神州綠盟科技有限公司,未經(jīng)北京神州綠盟信息安全科技股份有限公司;北京神州綠盟科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201611207732.3/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





