[發明專利]報文的識別方法、裝置、電子設備及介質有效
| 申請號: | 202110397527.2 | 申請日: | 2021-04-13 |
| 公開(公告)號: | CN113114679B | 公開(公告)日: | 2023-03-24 |
| 發明(設計)人: | 吳鴻霖;呂博良;葉紅;姜城 | 申請(專利權)人: | 中國工商銀行股份有限公司 |
| 主分類號: | H04L9/40 | 分類號: | H04L9/40;H04L67/06;G06F18/214;G06F18/24 |
| 代理公司: | 中科專利商標代理有限責任公司 11021 | 代理人: | 趙婷 |
| 地址: | 100140 北*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 報文 識別 方法 裝置 電子設備 介質 | ||
本公開提供了一種報文的識別方法,屬于大數據領域。該方法包括:獲取訪問網站的請求報文;以及利用分類器模型識別所述請求報文屬于文件上傳報文或非文件上傳報文,以根據識別結果處理所述請求報文;其中,所述分類器模型為基于多個歷史請求報文訓練得到的二分類機器學習模型。本公開還提供了一種報文的識別裝置、一種電子設備、以及一種計算機可讀存儲介質。
技術領域
本公開屬于人工智能技術領域,更具體地,涉及一種報文的識別方法、裝置、電子設備、及計算機可讀存儲介質。
背景技術
在現代互聯網的web應用程序當中,為了提高業務效率,往往有上傳文件的功能,但是這也會提高web應用受到攻擊的風險,如果web應用存在文件上傳漏洞,那么攻擊者就可以利用這個漏洞進行攻擊,進而造成控制整個網站,甚至控制服務器的危害。因此,對訪問web應用程序的文件上傳報文進行監控和處理對保護web應用程序非常重要,而這也要求能夠首先從大量訪問web應用程序的請求報文中甄別出文件上傳報文。
發明內容
有鑒于此,本公開實施例提供了一種報文的識別方法、裝置、電子設備及介質,能夠在較大程度上智能地、自動化地識別出請求報文是否為文件上傳報文,便于網站對報文進行分析處理。
本公開實施例的一個方面,提供了一種報文的識別方法。該方法包括:獲取訪問網站的請求報文;以及利用分類器模型識別所述請求報文屬于文件上傳報文或非文件上傳報文,以根據識別結果處理所述請求報文;其中,所述分類器模型為基于多個歷史請求報文訓練得到的二分類機器學習模型。
根據本公開的實施例,所述利用分類器模型識別所述請求報文屬于文件上傳報文或非文件上傳報文,包括以如下任意一種方式或多種方式的組合,得到所述請求報文的特征矩陣:基于對所述請求報文中的字符的自然語言處理,獲得所述請求報文的字符分布特征矩陣;基于將所述請求報文中的字符與預設的行為詞典矩陣空間的匹配,獲得所述請求報文的上傳行為分布特征矩陣;或者,基于對所述請求報文中的字符與預設的類型詞典矩陣空間的匹配,獲得所述請求報文的文件類型特征矩陣。其中,所述行為詞典矩陣空間由用于表征與報文的上傳行為相關的詞構成,所述類型詞典矩陣空間由用于表征上傳的文件的詞構成。然后,將所述請求報文的特征矩陣輸入到所述分類器模型,以獲得所述分類器模型輸出的分類結果。
根據本公開的實施例,所述得到所述請求報文的特征矩陣還包括,將所述字符分布特征矩陣、所述上傳行為分布特征矩陣、和所述文件類型特征矩陣拼接,得到所述請求報文的特征矩陣。
根據本公開的實施例,所述基于對所述請求報文中的字符的自然語言處理,獲得所述請求報文的字符分布特征矩陣包括:對所述請求報文以字符為分詞的最小單位進行n-gram分詞,得到所述請求報文的分詞列表;以及將所述分詞列表與預設的分詞矩陣空間對比,得到所述請求報文的字符分布特征矩陣。其中,所述分詞矩陣空間為基于對多個所述歷史請求報文以字符為最小單位進行n-gram分詞后,再經過逆向詞頻TF-IDF統計后得到的分詞構成。
根據本公開的實施例,所述對所述述請求報文以字符為分詞的最小單位進行n-gram分詞包括,對所述請求報文的請求行、請求頭以及請求體的參數中的字符進行n-gram分詞。
根據本公開的實施例,所述行為詞典矩陣空間中的詞包括以下至少之一:upload,filename,boundary、data、或path;和/或所述類型詞典矩陣空間中的詞包括以下至少之一:png、jpg、jpeg、image、gif、bmp、ffd8、或424D。
根據本公開的實施例,所述分類器模型是通過如下方式訓練得到的:獲取多個所述歷史請求報文;將每個所述歷史請求報文標記為文件上傳報文或非文件上傳報文;按照與獲得所述請求報文的特征矩陣相同的方式提取每個所述歷史請求報文的特征矩陣;以及以每個所述歷史請求報文的特征矩陣作為輸入、以每個所述歷史請求報文的標記作為輸出參考,訓練所述分類器模型。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國工商銀行股份有限公司,未經中國工商銀行股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110397527.2/2.html,轉載請聲明來源鉆瓜專利網。





