[發(fā)明專利]一種網絡流量識別方法及裝置有效
| 申請?zhí)枺?/td> | 201711483710.4 | 申請日: | 2017-12-29 |
| 公開(公告)號: | CN109995601B | 公開(公告)日: | 2020-12-01 |
| 發(fā)明(設計)人: | 孫昌清;熊龍 | 申請(專利權)人: | 中國移動通信集團上海有限公司;中國移動通信有限公司研究院 |
| 主分類號: | H04L12/26 | 分類號: | H04L12/26;H04L12/24;G06N3/08;G06N3/04 |
| 代理公司: | 北京路浩知識產權代理有限公司 11002 | 代理人: | 王瑩;李相雨 |
| 地址: | 200060 *** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 網絡流量 識別 方法 裝置 | ||
本發(fā)明實施例公開了一種網絡流量識別方法及裝置,方法包括:根據具有卷積神經網絡特征的區(qū)域R?CNN模型對運行在純凈模擬器環(huán)境中的應用程序的界面進行對象識別,得到應用程序的動態(tài)操作行為信息;根據當前的操作行為類型和動態(tài)操作行為信息,對應用程序的操作行為進行分類觸發(fā),監(jiān)聽分類觸發(fā)后的流量,并對分類觸發(fā)后的流量進行流量標定,得到樣本流量;將樣本流量輸入字符級循環(huán)神經網絡char?RNN模型進行訓練,得到目標模型,根據目標模型對網絡流量進行識別。彌補了代碼靜態(tài)分析獲取操作行為的不足;根據操作行為類型有針對性地觸發(fā)并監(jiān)聽流量,省時省力;通過目標模型來識別網絡管道中的混雜用戶流量,以挖掘用戶所使用的應用程序中的操作行為信息。
技術領域
本發(fā)明實施例涉及通信網絡技術領域,具體涉及一種網絡流量識別方法及裝置。
背景技術
隨著移動終端設備的普及和移動互聯網的發(fā)展,智能移動終端設備及其衍生的移動終端應用程序(APP),在人們的生產生活中扮演著越來越重要的角色,成為人們上網、購物和娛樂的主要途徑。因此,通過深度分析移動互聯網流量,學習用戶的畫像和網絡行為信息,對諸如廣告推薦系統(tǒng)和網絡管理等應用程序有著重要的作用。網絡運營商分析網絡管道中的混雜流量(大量用戶的網絡數據混雜在一起),學習到移動網絡用戶某時(網絡流量中包含時間戳)某地(GPS以及基站可以提供位置信息)所使用的APP名稱、具體的按鍵操作等有價值信息。例如:通過某種方法,網絡運營商可以知道,某用戶在北京市西城區(qū),在美團APP中點擊了酒店按鍵,瀏覽附近的酒店信息,那么網絡運營商就可以針對該用戶定向投放附近酒店的廣告信息。
目前,流量特征識別方法主要有:基于預定義或特殊端口的流量特征提取方法、基于DPI(Deep Packet Inspection,深度包檢測)的流量特征提取方法和基于機器學習的流量分類方法。其中,基于預定義或特殊端口的流量特征提取方法為根據通用的網絡協議端口來提取識別網絡流量,或根據預定義的特殊端口,提取識別網絡流量;基于DPI的流量特征提取方法為根據確定經驗和規(guī)則,從流量內容中提取符合指定條件的特征字/指紋/序列,作為流量特征;基于機器學習的流量分類方法為根據預先訓練好的機器學習模型對流量進行分類。
在實現本發(fā)明實施例的過程中,發(fā)明人發(fā)現現有的流量特征識別方法存在如下問題:基于預定義或特殊端口的流量識別方法對于非標準端口或新定義的端口不適用,且識別粒度不夠,無法精準定位具體的應用操作;基于DPI的流量特征提取方法的特征提取過程為監(jiān)督或半監(jiān)督方式,確定特征字/指紋/序列的過程耗時耗力,且APP操作流量類型和內容復雜多變,無法找到通用化的特征關鍵字定位及提取方法;基于機器學習的流量分類方法的分類粒度不夠,只能用于流量協議類型的分類問題,無法識別用戶具體使用的APP操作行為。
發(fā)明內容
由于現有方法存在上述問題,本發(fā)明實施例提出一種網絡流量識別方法及裝置。
第一方面,本發(fā)明實施例提出一種網絡流量識別方法,包括:
根據具有卷積神經網絡特征的區(qū)域R-CNN模型對運行在純凈模擬器環(huán)境中的應用程序的界面進行對象識別,得到所述應用程序的動態(tài)操作行為信息;
根據當前的操作行為類型和所述動態(tài)操作行為信息,對所述應用程序的操作行為進行分類觸發(fā),監(jiān)聽分類觸發(fā)后的流量,并對所述分類觸發(fā)后的流量進行流量標定,得到樣本流量;
將所述樣本流量輸入字符級循環(huán)神經網絡char-RNN模型進行訓練,得到目標模型,根據所述目標模型對網絡流量進行識別。
可選地,所述根據具有卷積神經網絡特征的區(qū)域R-CNN模型對所述應用程序運行過程中的界面進行對象識別,得到所述應用程序的動態(tài)操作行為信息,具體包括:
根據所述R-CNN模型的卷積層對所述應用程序運行過程中的界面進行多層卷積,獲得所述界面的抽象特征圖;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國移動通信集團上海有限公司;中國移動通信有限公司研究院,未經中國移動通信集團上海有限公司;中國移動通信有限公司研究院許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201711483710.4/2.html,轉載請聲明來源鉆瓜專利網。





