[發(fā)明專利]基于SVM機(jī)器學(xué)習(xí)的惡意域名檢測方法在審
| 申請?zhí)枺?/td> | 201910971102.0 | 申請日: | 2019-10-14 |
| 公開(公告)號(hào): | CN110866611A | 公開(公告)日: | 2020-03-06 |
| 發(fā)明(設(shè)計(jì))人: | 溫延龍;范淵 | 申請(專利權(quán))人: | 杭州安恒信息技術(shù)股份有限公司 |
| 主分類號(hào): | G06N20/10 | 分類號(hào): | G06N20/10;H04L29/06;H04L29/12 |
| 代理公司: | 杭州中成專利事務(wù)所有限公司 33212 | 代理人: | 金祺;周世駿 |
| 地址: | 310051 浙江省*** | 國省代碼: | 浙江;33 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 基于 svm 機(jī)器 學(xué)習(xí) 惡意 域名 檢測 方法 | ||
1.基于SVM機(jī)器學(xué)習(xí)的惡意域名檢測方法,其特征在于:包括以下步驟:
1)、收集數(shù)據(jù);
2)、確定需要的維度;
3)、獲得收集數(shù)據(jù)的維度,作為訓(xùn)練集數(shù)據(jù);
4)、利用SVM模型對(duì)訓(xùn)練集數(shù)據(jù)進(jìn)行訓(xùn)練生成模型;
5)、測試訓(xùn)練結(jié)果調(diào)整準(zhǔn)確率。
2.根據(jù)權(quán)利要求1所述的基于SVM機(jī)器學(xué)習(xí)的惡意域名檢測方法,其特征在于:
在步驟1中:獲取惡意域名作為收集數(shù)據(jù)的負(fù)樣本;獲取非惡意域名作為收集數(shù)據(jù)的正樣本。
3.根據(jù)權(quán)利要求2所述的基于SVM機(jī)器學(xué)習(xí)的惡意域名檢測方法,其特征在于:
確定維度包括域名的Alexa排名、搜狗RanK、搜狗的域名收入量、百度的收入量、必應(yīng)的收入量、網(wǎng)站的首頁完整度、是否是主流域名后綴、域名IP解析地理位置、A記錄與CNAME、域名WHOIS數(shù)據(jù)。
4.根據(jù)權(quán)利要求3所述的基于SVM機(jī)器學(xué)習(xí)的惡意域名檢測方法,其特征在于:
收集10種維度數(shù)據(jù)的方式:
Alexa排名:通過接口獲取域名的排行,如果沒有排行設(shè)置為較大值;
搜狗RanK:搜狗RanK值越大網(wǎng)站越大;沒有搜狗RanK的設(shè)為0;
搜狗的域名收入量:通過搜狗搜索引擎獲取域名收入量;沒有收入量設(shè)為0;
百度的域名收入量:通過百度搜索引擎獲取域名收入量;沒有收入量設(shè)為0;
網(wǎng)站首頁的完整度:判斷網(wǎng)頁首頁是否包含<html><script><table><title><img><link><a><body><css>,越完整分?jǐn)?shù)越高累加,首頁為空則為0;
是否主流域名后綴:主流域名的主流后綴為.com、.net.、.cn;
域名解析IP地理位置:域名是否在國外;
A記錄CNAME:有A記錄CNAME的記1,沒有的記為0;
域名WHOIS:有WHOIS并且是匿名注冊的記0,有WHOIS并且不是匿名注冊的記1;
必應(yīng)的收入量:通過必應(yīng)搜索引擎獲取域名收入量,沒有收入量設(shè)為0。
5.根據(jù)權(quán)利要求4所述的基于SVM機(jī)器學(xué)習(xí)的惡意域名檢測方法,其特征在于:
步驟4包括:
4.1)、首先載入訓(xùn)練集數(shù)據(jù);
4.2)、訓(xùn)練集數(shù)據(jù)數(shù)據(jù)歸一化,得到歸一化之后的數(shù)據(jù);將數(shù)據(jù)縮小至方差為1均值0的數(shù)組;
4.3)、將歸一化之后的數(shù)據(jù)劃分為訓(xùn)練樣本和測試樣本,將訓(xùn)練樣本放入SVM算法中進(jìn)行訓(xùn)練,利用訓(xùn)練樣本進(jìn)行模型的驗(yàn)證,使用SVM算法進(jìn)行模型的訓(xùn)練。
6.根據(jù)權(quán)利要求5所述的基于SVM機(jī)器學(xué)習(xí)的惡意域名檢測方法,其特征在于:
步驟5)、測試訓(xùn)練結(jié)果調(diào)整準(zhǔn)確率的方法包括:
1:利用模型對(duì)數(shù)據(jù)進(jìn)行識(shí)別,將識(shí)別結(jié)果重新放入訓(xùn)練樣本進(jìn)行訓(xùn)練,加訓(xùn)練樣本;
2:利用交叉驗(yàn)證的方法,設(shè)置模型的參數(shù)進(jìn)行驗(yàn)證,計(jì)算模型的最優(yōu)解參數(shù),根據(jù)最優(yōu)解對(duì)數(shù)據(jù)進(jìn)行重新模型的訓(xùn)練。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于杭州安恒信息技術(shù)股份有限公司,未經(jīng)杭州安恒信息技術(shù)股份有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910971102.0/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 基于支持向量機(jī)的入侵檢測方法
- 一種提高SVM建模準(zhǔn)確率的方法
- 一種用于解決多分類問題的糾錯(cuò)SVM分類方法
- 基于SVM分類器的隱私保護(hù)和數(shù)據(jù)安全訪問的方法
- 基于SVM算法的客戶用電需求識(shí)別方法
- 基于V-SVM的DDoS攻擊檢測方法和裝置
- 一種改進(jìn)最小二乘支持向量機(jī)的諧波發(fā)射水平評(píng)估方法
- 基于SVM模型的GNSS觀測數(shù)據(jù)質(zhì)量控制及定位方法
- 用于自動(dòng)選擇安全虛擬機(jī)的系統(tǒng)和方法
- 一種基于BAS-SVM的配電網(wǎng)電壓暫降源識(shí)別方法
- 根據(jù)用戶學(xué)習(xí)效果動(dòng)態(tài)變化下載學(xué)習(xí)數(shù)據(jù)的系統(tǒng)及方法
- 用于智能個(gè)人化學(xué)習(xí)服務(wù)的方法
- 漸進(jìn)式學(xué)習(xí)管理方法及漸進(jìn)式學(xué)習(xí)系統(tǒng)
- 輔助學(xué)習(xí)的方法及裝置
- 基于人工智能的課程推薦方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 基于強(qiáng)化學(xué)習(xí)的自適應(yīng)移動(dòng)學(xué)習(xí)路徑生成方法
- 一種線上視頻學(xué)習(xí)系統(tǒng)
- 一種基于校園大數(shù)據(jù)的自適應(yīng)學(xué)習(xí)方法、裝置及設(shè)備
- 一種學(xué)習(xí)方案推薦方法、裝置、設(shè)備和存儲(chǔ)介質(zhì)
- 游戲?qū)W習(xí)效果評(píng)測方法及系統(tǒng)





