[發明專利]基于HTML的網站行為模型建模方法有效
| 申請號: | 201110121990.0 | 申請日: | 2011-05-12 |
| 公開(公告)號: | CN102780682A | 公開(公告)日: | 2012-11-14 |
| 發明(設計)人: | 蔣昌俊;陳閎中;閆春鋼;丁志軍;許華杰;葛雍龍 | 申請(專利權)人: | 同濟大學 |
| 主分類號: | H04L29/06 | 分類號: | H04L29/06;G06F21/00 |
| 代理公司: | 上海光華專利事務所 31219 | 代理人: | 余明偉 |
| 地址: | 200092 *** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 html 網站 行為 模型 建模 方法 | ||
1.一種基于HTML的網站行為模型建模方法,其應用在連接有網絡系統的客戶端中,且所述客戶端通過所述網絡系統實現對網站提供商提供的網站進行訪問,所述方法包括:
1)通過所述網絡系統獲取網站提供商所提供的網站的源代碼,并從所獲取的源代碼中提取網站所有網頁的HTML代碼,HTML代碼中包含多個類型標簽以及行為屬性;以及
2)掃描該網頁的HTML代碼,依據HTML代碼中不同類型的標簽以及行為屬性,記錄每一類型標簽中的各種行為以及每一行為發生后的狀態,以由各個相關聯的行為與狀態形成行為序列,而由此形成的多個行為序列的集合最終構建成網站行為模型。
2.根據權利要求1所述的基于HTML的網站行為模型建模方法,其特征在于,所述類型標簽為<a>、<form>、<input>或<button>。
3.根據權利要求2所述的基于HTML的網站行為模型建模方法,其特征在于,對應<a>類型標簽的行為為點擊超鏈接類型行為以及網頁跳轉類型行為;對應<form>類型標簽的行為為提交數據類型行為;對應<input>或<button>類型標簽的行為為點擊按鈕類型行為。
4.根據權利要求3所述的基于HTML的網站行為模型建模方法,其特征在于,所述步驟2)進一步包括:
2-1)創建一個網址類型的狀態S0,取變量i=1,并將首頁加入網址隊列中;
2-2)判斷網址隊列是否為空,若是,則建模完成,若否,則從網址隊列的隊首取出一個網址,并記錄下網站所有狀態集中其相應的網址類型的狀態Sj,且獲取其對應頁面的HTML代碼;
2-3)掃描所獲取的HTML代碼,當遇到HTML代碼中的<a>標簽,進至下一個步驟;當遇到HTML代碼中的<form>標簽且其行為屬性為提交數據類型時,進至步驟2-5);否則,直至掃描完HTML代碼,返回步驟2-2);
2-4)創建一個點擊超鏈接類型的狀態Si,以及一個相應的網址類型的狀態Si+1,若狀態Si+1不屬于網站所有狀態集,則將狀態Si+1加入網站所有狀態集中,并將<a>標簽中的超鏈接的網址加入網址隊列,并且在狀態Si的行為集添加網頁跳轉類型行為,并將狀態Si+1加入到在狀態Si下發生該網頁跳轉類型行為后可能到達的狀態集中,在狀態Sj的行為集添加點擊超鏈接類型行為,將狀態Si加入到在狀態Sj下發生該點擊超鏈接類型行為后可能到達的狀態集中,將變量i+2賦值給i,并返回到步驟2-3)繼續掃描;以及
2-5)創建一個提交數據類型的狀態Si,若狀態Si不屬于網站所有狀態集,則將狀態Si加入網站所有狀態集,并繼續掃描<form>中的子標簽,當遇到<input>或<button>,則創建一個點擊按鈕類型的狀態Si+1,并且在狀態Si+1的行為集添加提交數據類型行為,將狀態Si加入到在狀態Si+1下發生該提交數據類型行為后可能到達的狀態集中,在狀態Sj的行為集添加點擊按鈕類型行為,將狀態Si+1加入到在狀態Sj下發生該點擊按鈕類型行為后可能到達的狀態集中,將變量i+2賦值給i,并返回到步驟2-3)繼續掃描。
5.根據權利要求4所述的基于HTML的網站行為模型建模方法,其特征在于,所述狀態為穩定狀態或非穩定狀態。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于同濟大學,未經同濟大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201110121990.0/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種能快速組合、分解的檢波器串
- 下一篇:一種泄壓保護裝置





