[發(fā)明專利]一種嵌套的應(yīng)用層協(xié)議的狀態(tài)機(jī)提取系統(tǒng)及其提取方法有效
| 申請(qǐng)?zhí)枺?/td> | 201711387748.1 | 申請(qǐng)日: | 2017-12-20 |
| 公開(公告)號(hào): | CN108055166B | 公開(公告)日: | 2021-02-12 |
| 發(fā)明(設(shè)計(jì))人: | 余順爭(zhēng);吳廣銳 | 申請(qǐng)(專利權(quán))人: | 中山大學(xué) |
| 主分類號(hào): | H04L12/26 | 分類號(hào): | H04L12/26;H04L29/08;H04L29/06;G06F40/284;G06F16/35 |
| 代理公司: | 廣州粵高專利商標(biāo)代理有限公司 44102 | 代理人: | 林麗明 |
| 地址: | 510275 廣東*** | 國省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 嵌套 應(yīng)用 協(xié)議 狀態(tài)機(jī) 提取 系統(tǒng) 及其 方法 | ||
1.一種嵌套的應(yīng)用層協(xié)議的狀態(tài)機(jī)提取系統(tǒng),其特征在于:包括數(shù)據(jù)采集和輸入模塊、數(shù)據(jù)預(yù)處理模塊、關(guān)鍵詞提取模塊、消息聚類模塊、模型訓(xùn)練模塊和狀態(tài)譯碼模塊;其中數(shù)據(jù)采集和輸入模塊用于采集訓(xùn)練集的嵌套的應(yīng)用層協(xié)議的數(shù)據(jù)流,得到具體的數(shù)據(jù)文件并將得到的數(shù)據(jù)文件傳輸至數(shù)據(jù)預(yù)處理模塊;數(shù)據(jù)預(yù)處理模塊用于接收數(shù)據(jù)文件并對(duì)數(shù)據(jù)文件進(jìn)行HTTP數(shù)據(jù)包的提取處理,然后將提取的HTTP數(shù)據(jù)包按照四元組的形式組合成會(huì)話;數(shù)據(jù)預(yù)處理模塊將形成的會(huì)話列表傳輸至關(guān)鍵詞提取模塊;關(guān)鍵詞提取模塊用于接收數(shù)據(jù)預(yù)處理模塊傳輸?shù)臅?huì)話列表,然后從會(huì)話列表中提取HTTP數(shù)據(jù)包的關(guān)鍵詞;提取得到關(guān)鍵詞后,保留會(huì)話列表中HTTP數(shù)據(jù)包的關(guān)鍵詞,刪除HTTP數(shù)據(jù)包中的非關(guān)鍵詞字節(jié);消息聚類模塊用于采用X-Means算法對(duì)關(guān)鍵詞提取模塊處理后的會(huì)話列表進(jìn)行聚類,得到具體的參數(shù)傳輸至模型訓(xùn)練模塊;模型訓(xùn)練模塊用于接收聚類模塊傳輸?shù)膮?shù)對(duì)模型進(jìn)行初始化及訓(xùn)練;測(cè)試集中嵌套應(yīng)用層協(xié)議的數(shù)據(jù)流依次經(jīng)過數(shù)據(jù)采集和輸入模塊、數(shù)據(jù)預(yù)處理模塊、關(guān)鍵詞提取模塊、消息聚類模塊的處理后得到具體的參數(shù)傳輸至訓(xùn)練好的模型,模型輸出的觀測(cè)值序列傳輸至狀態(tài)譯碼模塊,狀態(tài)譯碼模塊進(jìn)行譯碼得到其對(duì)應(yīng)的狀態(tài)序列。
2.根據(jù)權(quán)利要求1所述的嵌套的應(yīng)用層協(xié)議的狀態(tài)機(jī)提取系統(tǒng),其特征在于:數(shù)據(jù)采集和輸入模塊采用wireshark軟件進(jìn)行嵌套的應(yīng)用層協(xié)議的數(shù)據(jù)流的采集,得到pcap文件。
3.根據(jù)權(quán)利要求1所述的嵌套的應(yīng)用層協(xié)議的狀態(tài)機(jī)提取系統(tǒng),其特征在于:所述關(guān)鍵詞提取模塊從HTTP請(qǐng)求方法、URL中的各層目錄、JSON格式數(shù)據(jù)中的key值和響應(yīng)碼所處位置提取關(guān)鍵詞。
4.根據(jù)權(quán)利要求1所述的嵌套的應(yīng)用層協(xié)議的狀態(tài)機(jī)提取系統(tǒng),其特征在于:所述消息聚類模塊在聚類時(shí)按照關(guān)鍵詞的URL層級(jí)或JSON層級(jí)的不同賦予相應(yīng)的權(quán)重。
5.根據(jù)權(quán)利要求1所述的嵌套的應(yīng)用層協(xié)議的狀態(tài)機(jī)提取系統(tǒng),其特征在于:所述模型訓(xùn)練模塊使用前向-后向算法對(duì)模型進(jìn)行訓(xùn)練。
6.根據(jù)權(quán)利要求1所述的嵌套的應(yīng)用層協(xié)議的狀態(tài)機(jī)提取系統(tǒng),其特征在于:所述狀態(tài)譯碼模塊使用Viterbi算法對(duì)模型輸出的觀測(cè)值序列進(jìn)行譯碼。
7.根據(jù)權(quán)利要求1~6任一項(xiàng)所述的嵌套的應(yīng)用層協(xié)議的狀態(tài)機(jī)提取系統(tǒng),其特征在于:所述數(shù)據(jù)預(yù)處理模塊定義一個(gè)Packet類來儲(chǔ)存提取的HTTP數(shù)據(jù)包。
8.根據(jù)權(quán)利要求1~6任一項(xiàng)所述的嵌套的應(yīng)用層協(xié)議的狀態(tài)機(jī)提取系統(tǒng),其特征在于:所述關(guān)鍵詞提取模塊定義一個(gè)PacketVector類儲(chǔ)存刪除非關(guān)鍵詞字節(jié)后的HTTP數(shù)據(jù)包的信息。
9.根據(jù)權(quán)利要求1~6任一項(xiàng)所述的嵌套的應(yīng)用層協(xié)議的狀態(tài)機(jī)提取系統(tǒng),其特征在于:所述模型訓(xùn)練模塊訓(xùn)練的模型為一階-二階混合隱馬爾科夫模型。
10.一種根據(jù)權(quán)利要求1~9任一項(xiàng)狀態(tài)機(jī)提取系統(tǒng)的提取方法,其特征在于:包括以下步驟:
(1)數(shù)據(jù)采集和輸入模塊采集訓(xùn)練集的嵌套的應(yīng)用層協(xié)議的數(shù)據(jù)流,得到具體的數(shù)據(jù)文件并將得到的數(shù)據(jù)文件傳輸至數(shù)據(jù)預(yù)處理模塊;
(2)數(shù)據(jù)預(yù)處理模塊接收數(shù)據(jù)文件并對(duì)數(shù)據(jù)文件進(jìn)行HTTP數(shù)據(jù)包的提取處理,然后將提取的HTTP數(shù)據(jù)包按照四元組的形式組合成會(huì)話;數(shù)據(jù)預(yù)處理模塊將形成的會(huì)話列表傳輸至關(guān)鍵詞提取模塊;
(3)關(guān)鍵詞提取模塊接收數(shù)據(jù)預(yù)處理模塊傳輸?shù)臅?huì)話列表,然后從會(huì)話列表中提取HTTP數(shù)據(jù)包的關(guān)鍵詞;提取得到關(guān)鍵詞后,保留會(huì)話列表中HTTP數(shù)據(jù)包的關(guān)鍵詞,刪除HTTP數(shù)據(jù)包中的非關(guān)鍵詞字節(jié);
(4)消息聚類模塊采用X-Means算法對(duì)關(guān)鍵詞提取模塊處理后的會(huì)話列表進(jìn)行聚類,得到具體的參數(shù)傳輸至模型訓(xùn)練模塊;
(5)模型訓(xùn)練模塊接收聚類模塊傳輸?shù)膮?shù)對(duì)模型進(jìn)行初始化及訓(xùn)練;
(6)測(cè)試集中嵌套應(yīng)用層協(xié)議的數(shù)據(jù)流依次經(jīng)過(1)~(5)的處理后得到具體的參數(shù)傳輸至訓(xùn)練好的模型,模型輸出的觀測(cè)值序列傳輸至狀態(tài)譯碼模塊,狀態(tài)譯碼模塊進(jìn)行譯碼得到其對(duì)應(yīng)的狀態(tài)序列。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于中山大學(xué),未經(jīng)中山大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201711387748.1/1.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 在線應(yīng)用平臺(tái)上應(yīng)用間通信的回調(diào)應(yīng)答方法、應(yīng)用及在線應(yīng)用平臺(tái)
- 應(yīng)用使用方法、應(yīng)用使用裝置及相應(yīng)的應(yīng)用終端
- 應(yīng)用管理設(shè)備、應(yīng)用管理系統(tǒng)、以及應(yīng)用管理方法
- 能力應(yīng)用系統(tǒng)及其能力應(yīng)用方法
- 應(yīng)用市場(chǎng)的應(yīng)用搜索方法、系統(tǒng)及應(yīng)用市場(chǎng)
- 使用應(yīng)用的方法和應(yīng)用平臺(tái)
- 應(yīng)用安裝方法和應(yīng)用安裝系統(tǒng)
- 使用遠(yuǎn)程應(yīng)用進(jìn)行應(yīng)用安裝
- 應(yīng)用檢測(cè)方法及應(yīng)用檢測(cè)裝置
- 應(yīng)用調(diào)用方法、應(yīng)用發(fā)布方法及應(yīng)用發(fā)布系統(tǒng)
- 圖像診斷裝置、醫(yī)用系統(tǒng)以及協(xié)議管理方法
- 一種自動(dòng)協(xié)議識(shí)別方法及系統(tǒng)
- 客戶端中遞送協(xié)議數(shù)據(jù)單元的方法及相關(guān)裝置
- 遠(yuǎn)程通訊系統(tǒng)
- 一種基于可拼裝通信協(xié)議棧的通信方法及系統(tǒng)
- 一種實(shí)現(xiàn)國產(chǎn)平臺(tái)PXEBOOT的協(xié)議架構(gòu)
- CBTC通信系統(tǒng)協(xié)議解析方法、協(xié)議庫管理方法
- 一種協(xié)議轉(zhuǎn)換的方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 一種用于燈光控制的協(xié)議轉(zhuǎn)換系統(tǒng)及方法
- 一種通用工藝人工智能物聯(lián)網(wǎng)網(wǎng)關(guān)
- 一種使用狀態(tài)機(jī)測(cè)試網(wǎng)元接口的方法
- 狀態(tài)機(jī)的通信處理方法和系統(tǒng)
- 分布式實(shí)現(xiàn)LACP標(biāo)準(zhǔn)狀態(tài)機(jī)的方法及系統(tǒng)
- 一種狀態(tài)機(jī)協(xié)作控制方法、裝置及狀態(tài)機(jī)系統(tǒng)
- 有限狀態(tài)機(jī)的執(zhí)行系統(tǒng)及執(zhí)行方法
- 協(xié)議解析的方法和裝置
- 狀態(tài)機(jī)配置器
- 一種用于雙通道CCD成像系統(tǒng)的時(shí)序發(fā)生器及時(shí)序驅(qū)動(dòng)方法
- 一種用于雙通道CCD成像系統(tǒng)的時(shí)序發(fā)生器
- 一種擴(kuò)展?fàn)顟B(tài)機(jī)邏輯的方法、裝置、存儲(chǔ)介質(zhì)和電子裝置





