[發(fā)明專利]一種基于機(jī)器學(xué)習(xí)的web指紋識別方法在審
| 申請?zhí)枺?/td> | 201911335939.2 | 申請日: | 2019-12-24 |
| 公開(公告)號: | CN111092769A | 公開(公告)日: | 2020-05-01 |
| 發(fā)明(設(shè)計(jì))人: | 李明軒;舒斐;李峰;王斌;鄒振婉 | 申請(專利權(quán))人: | 國網(wǎng)新疆電力有限公司電力科學(xué)研究院 |
| 主分類號: | H04L12/24 | 分類號: | H04L12/24;H04L29/08;G06K9/62;G06N20/00 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 830001 新疆維吾爾*** | 國省代碼: | 新疆;65 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 機(jī)器 學(xué)習(xí) web 指紋識別 方法 | ||
1.一種基于機(jī)器學(xué)習(xí)的web指紋識別方法,其特征在于,包括以下步驟:
S1數(shù)據(jù)收集:收集或創(chuàng)建多個(gè)站點(diǎn),之后我們對這些站點(diǎn)發(fā)送設(shè)計(jì)好的請求,分別對其對應(yīng)的響應(yīng)報(bào)文進(jìn)行分類,將這些響應(yīng)報(bào)文和其對應(yīng)的Web指紋進(jìn)行歸類,將這些響應(yīng)報(bào)文分為訓(xùn)練集和測試集;
S2數(shù)據(jù)處理:對于收集到的存在不同Web指紋的響應(yīng)報(bào)文,將其中包含的每個(gè)字符以數(shù)字進(jìn)行代替;
S3模型訓(xùn)練;
S4結(jié)束訓(xùn)練;
S5行為預(yù)測。
2.如權(quán)利要求1所述的一種基于機(jī)器學(xué)習(xí)的web指紋識別方法,其特征在于,所述步驟S2具體步驟為:這里假設(shè)所有的響應(yīng)報(bào)文中包含的字符類型總數(shù)為n,每一個(gè)字符a都對應(yīng)一個(gè)數(shù)字xa,這樣可以將一條響應(yīng)報(bào)文使用一個(gè)長度為n的向量代替,這里對于每一個(gè)報(bào)文m的第i個(gè)字符mi,若其對應(yīng)的數(shù)字為那么就在其對應(yīng)向量的第個(gè)元素上加1,以此類推最終得到一個(gè)長度為n的數(shù)字向量,該向量即為原報(bào)文的數(shù)字向量形式;
所述步驟S3具體步驟為:在獲得響應(yīng)報(bào)文對應(yīng)的字符向量后,首先我們對這些向量進(jìn)行聚類,類的個(gè)數(shù)即為原響應(yīng)報(bào)文集中需要進(jìn)行分類的不同種類Web指紋個(gè)數(shù):
對于兩個(gè)不同的響應(yīng)報(bào)文,他們的距離為:
其中t′為向量中第i個(gè)元素的參數(shù);
對于預(yù)測集中的響應(yīng)報(bào)文,計(jì)算出他們與所有測試集響應(yīng)報(bào)文的距離,得出距離最近的前10個(gè)響應(yīng)報(bào)文集,根據(jù)這10個(gè)響應(yīng)報(bào)文集中不同的Web指紋出現(xiàn)頻率,返回Web指紋出現(xiàn)頻率最高的類別作為預(yù)測的Web指紋;
在每次預(yù)測結(jié)束后,若本次預(yù)測結(jié)果與實(shí)際結(jié)果一致,則誤差記為0;若本次預(yù)測結(jié)果與實(shí)際結(jié)果不一致,則取對應(yīng)Web指紋中與預(yù)測報(bào)文最近的5個(gè)報(bào)文,計(jì)算其平均向量,則他們的誤差為:
當(dāng)一輪訓(xùn)練結(jié)束后,每次預(yù)測的誤差之和即為該輪預(yù)測的誤差;
所述步驟S4中具體步驟為:若當(dāng)前輪誤差在規(guī)定閾值內(nèi)或已經(jīng)達(dá)到最大輪數(shù),則結(jié)束訓(xùn)練過程,將此時(shí)的參數(shù)保存在本地,此時(shí)即視為模型已經(jīng)達(dá)到穩(wěn)定狀態(tài),可以用于進(jìn)行Web指紋的預(yù)測;之后進(jìn)行Web指紋預(yù)測時(shí),可以直接調(diào)用保存在本地的參數(shù)進(jìn)行預(yù)測,不再需要進(jìn)行額外的模型參數(shù)訓(xùn)練;若當(dāng)前輪誤差仍在規(guī)定閾值外且尚未達(dá)到最大輪數(shù),則根據(jù)誤差對模型參數(shù)進(jìn)行更新:
其中α為學(xué)習(xí)速率,Δ為誤差;
所述步驟S5具體步驟為:在得到訓(xùn)練完成的Web指紋預(yù)測模型后,當(dāng)我們需要對目標(biāo)站點(diǎn)的Web指紋進(jìn)行預(yù)測時(shí),我們只需要向目標(biāo)站點(diǎn)發(fā)送構(gòu)建好的Web請求,在得到返回的響應(yīng)報(bào)文后,將其轉(zhuǎn)換成數(shù)字向量形式后輸入Web指紋預(yù)測模型,模型則會將預(yù)測的Web指紋輸出,完成預(yù)測,用戶可以根據(jù)預(yù)測的Web指紋進(jìn)行下一步操作。
3.如權(quán)利要求2所述的一種基于機(jī)器學(xué)習(xí)的web指紋識別方法,其特征在于,所述步驟S1中Web指紋具體包括:Web容器包含Nginx、Apache等,Web服務(wù)端語言包括php、asp、Java等,Web后端框架包括Laravel、ThinkPHP、Django等,Web應(yīng)用包括Dedecms、WordPress、Discuz等,Web前端框架包括Bootstrap、ExtJS、Flex等,Web前端語言包含JavaScript、PHP、C#等。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于國網(wǎng)新疆電力有限公司電力科學(xué)研究院,未經(jīng)國網(wǎng)新疆電力有限公司電力科學(xué)研究院許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201911335939.2/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 上一篇:測重破胎裝置
- 下一篇:連接裝置和用于連接兩個(gè)部件的方法
- 根據(jù)用戶學(xué)習(xí)效果動態(tài)變化下載學(xué)習(xí)數(shù)據(jù)的系統(tǒng)及方法
- 用于智能個(gè)人化學(xué)習(xí)服務(wù)的方法
- 漸進(jìn)式學(xué)習(xí)管理方法及漸進(jìn)式學(xué)習(xí)系統(tǒng)
- 輔助學(xué)習(xí)的方法及裝置
- 基于人工智能的課程推薦方法、裝置、設(shè)備及存儲介質(zhì)
- 基于強(qiáng)化學(xué)習(xí)的自適應(yīng)移動學(xué)習(xí)路徑生成方法
- 一種線上視頻學(xué)習(xí)系統(tǒng)
- 一種基于校園大數(shù)據(jù)的自適應(yīng)學(xué)習(xí)方法、裝置及設(shè)備
- 一種學(xué)習(xí)方案推薦方法、裝置、設(shè)備和存儲介質(zhì)
- 游戲?qū)W習(xí)效果評測方法及系統(tǒng)
- 提供共享Web模塊的系統(tǒng)和方法
- 管理環(huán)球網(wǎng)網(wǎng)頁中的環(huán)球網(wǎng)媒體的系統(tǒng)及其實(shí)現(xiàn)方法
- 一種WEB業(yè)務(wù)實(shí)現(xiàn)系統(tǒng)、裝置及方法
- 高速緩存廣播信息的方法和裝置
- 基于QoS指標(biāo)和Web服務(wù)輸出參數(shù)的Web服務(wù)組合方法和裝置
- Web托管審查方法、裝置及Web托管系統(tǒng)
- 用于信息處理和Web瀏覽歷史導(dǎo)航的方法和設(shè)備及電子裝置
- 用于將web站點(diǎn)轉(zhuǎn)換為目標(biāo)web app站點(diǎn)的方法和裝置
- 用于防護(hù)WEB漏洞的方法和設(shè)備
- 一種Web攻擊報(bào)告生成方法、裝置、設(shè)備及計(jì)算機(jī)介質(zhì)





