[發(fā)明專利]網(wǎng)頁分類方法及裝置、存儲介質(zhì)及電子設(shè)備有效
| 申請?zhí)枺?/td> | 201711375002.9 | 申請日: | 2017-12-19 |
| 公開(公告)號: | CN108134784B | 公開(公告)日: | 2021-08-31 |
| 發(fā)明(設(shè)計)人: | 鄒榮珠 | 申請(專利權(quán))人: | 東軟集團(tuán)股份有限公司 |
| 主分類號: | H04L29/06 | 分類號: | H04L29/06;G06F16/953;G06F16/955;G06K9/62 |
| 代理公司: | 北京集佳知識產(chǎn)權(quán)代理有限公司 11227 | 代理人: | 李偉;王寶筠 |
| 地址: | 110179 遼*** | 國省代碼: | 遼寧;21 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 網(wǎng)頁 分類 方法 裝置 存儲 介質(zhì) 電子設(shè)備 | ||
本發(fā)明提供了一種網(wǎng)頁分類方法,在用戶需要對網(wǎng)頁進(jìn)行訪問時,對訪問的網(wǎng)頁進(jìn)行分類,從網(wǎng)頁的網(wǎng)頁元素中提取網(wǎng)頁特征,并將提取的各個網(wǎng)頁特征發(fā)送至與其對應(yīng)的初始分類器,本發(fā)明中,應(yīng)用了多個不同的初始分類器,每個初始分類器可以對惡意網(wǎng)頁進(jìn)行識別,且每個初始分類器所識別的惡意網(wǎng)頁的類別不同,各個初始分類器對接收到的各個網(wǎng)頁特征進(jìn)行處理,得到網(wǎng)頁的初級類別,然后將各個初級類別在集成分類器中進(jìn)行分析,以最終確定網(wǎng)頁的網(wǎng)頁類別,進(jìn)而可以使用戶根據(jù)待訪問網(wǎng)頁的網(wǎng)頁類別,決定是否對網(wǎng)頁進(jìn)行訪問,提升了用戶訪問網(wǎng)頁的安全性。
技術(shù)領(lǐng)域
本發(fā)明涉及互聯(lián)網(wǎng)技術(shù)領(lǐng)域,特別涉及一種網(wǎng)頁分類方法及裝置、存儲介質(zhì)及電子設(shè)備。
背景技術(shù)
隨著網(wǎng)絡(luò)資源的不斷豐富,人們通過網(wǎng)頁獲取資源和信息的需求不斷增多。用戶可以通過訪問不同網(wǎng)站的網(wǎng)頁,閱讀新聞信息、進(jìn)行購物或者觀看自己喜愛的視頻,在擴(kuò)展了個人信息量來源的同時,也豐富了個人生活。
與此同時,一些不法分子利用網(wǎng)頁進(jìn)行的惡意行為也呈爆發(fā)增長的趨勢。不法分子在用戶訪問網(wǎng)頁時,利用具有惡意行為的惡意網(wǎng)頁,破壞用戶的訪問過程,對用戶的財產(chǎn)、個人信息等造成了不同程度的損害,降低了用戶對網(wǎng)頁訪問的安全性。
發(fā)明內(nèi)容
本發(fā)明所要解決的技術(shù)問題是提供一種網(wǎng)頁分類方法,對用戶待訪問的網(wǎng)頁進(jìn)行分類,以確定待訪問網(wǎng)頁的網(wǎng)頁類別,避免用戶誤訪問惡意網(wǎng)頁,提高用戶對網(wǎng)頁訪問的安全性。
本發(fā)明還提供了一種網(wǎng)頁分類裝置,用以保證上述方法在實際中的實現(xiàn)及應(yīng)用。
一種網(wǎng)頁分類方法,所述方法包括:
從待分類網(wǎng)頁的網(wǎng)頁元素中提取網(wǎng)頁特征;
將每個網(wǎng)頁特征發(fā)送至與其元素屬性具有對應(yīng)關(guān)系的初始分類器,以得到所述待分類網(wǎng)頁的初級類別,不同的初始分類器識別不同的類別的惡意網(wǎng)頁;每一個所述初始分類器由其對應(yīng)的網(wǎng)頁元素中的網(wǎng)頁特征訓(xùn)練得到;
將每個所述初始分類器確定的初級類別,匯總至集成分類器,由所述集成分類器進(jìn)行分析,以最終確定所述待分類網(wǎng)頁的網(wǎng)頁類別。
上述的方法,可選的,所述將每個網(wǎng)頁特征發(fā)送至與其元素屬性具有對應(yīng)關(guān)系的初始分類器,以得到待分類網(wǎng)頁的初級類別,包括:
獲取第一元素屬性對應(yīng)的網(wǎng)頁特征,所述第一元素屬性對應(yīng)的網(wǎng)頁特征是可以確定所述待分類網(wǎng)頁是否為欺詐類型網(wǎng)頁的特征;
將所述第一元素屬性對應(yīng)的網(wǎng)頁特征所組成的特征向量輸入至欺詐網(wǎng)頁分類器,以得到所述待分類網(wǎng)頁的第一初始類別,所述第一初始類別為正常網(wǎng)頁、釣魚網(wǎng)頁、欺詐網(wǎng)頁或仿冒網(wǎng)頁。
上述的方法,可選的,所述將每個網(wǎng)頁特征發(fā)送至與其元素屬性具有對應(yīng)關(guān)系的初始分類器,以得到待分類網(wǎng)頁的初級類別,包括:
獲取第二元素屬性對應(yīng)的網(wǎng)頁特征;所述第二元素屬性對應(yīng)的網(wǎng)頁特征是從所述待分類網(wǎng)頁的源代碼中提取的,可確定所述待分類網(wǎng)頁是否為惡意入侵類型網(wǎng)頁的特征;
將所述第二元素屬性對應(yīng)的網(wǎng)頁特征所組成的特征向量輸入至惡意入侵網(wǎng)頁分類器,以得到所述待分類網(wǎng)頁的第二初始類別,所述第二初始類別為惡意廣告網(wǎng)頁、黑客入侵網(wǎng)頁、木馬網(wǎng)頁或正常網(wǎng)頁。
上述的方法,可選的,所述將每個網(wǎng)頁特征發(fā)送至與其元素屬性具有對應(yīng)關(guān)系的初始分類器,以得到待分類網(wǎng)頁的初級類別,包括:
獲取第三元素屬性對應(yīng)的網(wǎng)頁特征,所述第三元素屬性對應(yīng)的網(wǎng)頁特征是可確定所述待分類網(wǎng)頁是否為不合規(guī)類型網(wǎng)頁的特征;
將所述第三元素屬性對應(yīng)的網(wǎng)頁特征所組成的特征向量輸入至不合規(guī)網(wǎng)頁分類器,以得到所述待分類網(wǎng)頁的第三初始類別,所述第三初始類別為正常網(wǎng)頁、色情網(wǎng)頁、非法博彩網(wǎng)頁或違反法律法規(guī)網(wǎng)頁。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于東軟集團(tuán)股份有限公司,未經(jīng)東軟集團(tuán)股份有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201711375002.9/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





