[發明專利]一種應用識別方法、裝置、設備及存儲介質有效
| 申請號: | 202011490933.5 | 申請日: | 2020-12-16 |
| 公開(公告)號: | CN112615758B | 公開(公告)日: | 2022-04-29 |
| 發明(設計)人: | 田慧萌;萬月亮;火一莽 | 申請(專利權)人: | 北京銳安科技有限公司 |
| 主分類號: | H04L43/0876 | 分類號: | H04L43/0876;G06F16/22 |
| 代理公司: | 北京品源專利代理有限公司 11332 | 代理人: | 孟金喆 |
| 地址: | 100044 北京市海淀區西小口*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 應用 識別 方法 裝置 設備 存儲 介質 | ||
本發明公開了一種應用識別方法、裝置、設備及存儲介質。該方法包括:獲取目標終端發送的目標網絡流量數據;對所述目標網絡流量數據進行解析得到目標特征數據;根據所述目標特征數據查找應用識別特征庫,確定所述目標特征數據對應的目標應用。通過本發明的技術方案,能夠實現對海量應用的識別增強,效率提升且識別全面、準確性高,實現過程簡單易適應網絡時代APP日新月異的變化。
技術領域
本發明實施例涉及數據處理領域,尤其涉及一種應用識別的方法、裝置、設備及存儲介質。
背景技術
隨著移動互聯網的發展壯大,各類應用(Application,APP)層出不窮。當前APP應用總量約為三百萬,月均上下架的APP為十萬數量級別。在眾多APP產生的海量數據流量中反向識別出其對應的應用,成為一個繁重的工作。
其中,大部分APP采用了HTTP或HTTPS協議進行通信。
傳統的增強應用識別的方法是投入大量人力對有限數量APP進行分析,然后通過編寫模板的方式進行支持。這種方法不僅費時費力,而且難以跟上APP的變化速度,也難以覆蓋足夠多的APP。
發明內容
本發明實施例提供一種應用識別方法、裝置、設備及存儲介質,以實現能夠實現對海量應用的識別增強,效率提升且識別全面、準確性高。
第一方面,本發明實施例提供了應用識別,包括:
獲取目標終端發送的目標網絡流量數據;
對所述目標網絡流量數據進行解析得到目標特征數據;
根據所述目標特征數據查找應用識別特征庫,識別所述目標特征數據對應的目標應用。
進一步的,所述目標特征數據包括:目標HOST和/或目標SNI;
相應的,根據所述目標特征數據查找應用識別特征庫,確定所述目標特征數據對應的目標應用,包括:
根據所述目標HOST查找應用識別特征庫,確定所述目標HOST對應的目標應用ID和目標應用名稱,或者,根據所述目標SNI查找應用識別特征庫,確定所述目標SNI對應的目標應用ID和目標應用名稱。
進一步的,在獲取目標終端發送的目標網絡流量數據之前,還包括:
通過模擬器安裝至少一個應用;
獲取每個應用在運行期間產生的網絡流量數據;
將每個應用產生的網絡流量數據均保存為PCAP文件,其中,所述PCAP文件攜帶所述網絡流量數據對應的應用ID和應用名稱。
進一步的,在將每個應用產生的網絡流量數據均保存為PCAP文件之后,包括:
解析所述PCAP文件得到候選特征數據,以及所述候選特征數據對應的應用ID和應用名稱;
根據所述候選特征數據,以及所述候選特征數據對應的應用ID和應用名稱確定每個應用ID對應的第一特征數據;
將所述第一特征數據,以及所述第一特征數據對應的應用ID和應用名稱存儲至應用識別特征庫。
進一步的,根據所述候選特征數據,以及所述候選特征數據對應的應用ID和應用名稱確定每個應用ID對應的第一特征數據,包括:
獲取所有應用對應的候選特征數據;
根據所有應用對應的候選特征數據建立候選全局哈希表;
通過所述候選全局哈希表選取每個應用ID對應的第一特征數據。
進一步的,所述第一特征數據包括:全局唯一HOST和/或全局唯一SNI。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京銳安科技有限公司,未經北京銳安科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011490933.5/2.html,轉載請聲明來源鉆瓜專利網。





