[發明專利]二進制文件的分類方法、計算設備及存儲介質在審
| 申請號: | 202210022273.0 | 申請日: | 2022-01-10 |
| 公開(公告)號: | CN114492366A | 公開(公告)日: | 2022-05-13 |
| 發明(設計)人: | 楊晉 | 申請(專利權)人: | 阿里云計算有限公司 |
| 主分類號: | G06F40/194 | 分類號: | G06F40/194;G06K9/62;G06N3/04;G06N3/08;G06F21/56 |
| 代理公司: | 北京太合九思知識產權代理有限公司 11610 | 代理人: | 步文娟;張愛 |
| 地址: | 310012 浙江省*** | 國省代碼: | 浙江;33 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 二進制文件 分類 方法 計算 設備 存儲 介質 | ||
本申請實施例提供一種二進制文件的分類方法、計算設備及存儲介質。在本申請實施例中,獲取待分類二進制文件,獲取待分類二進制文件中對應的可變化代碼;確定可變化代碼的代碼特征,作為待分類二進制文件的文件特征;將待分類二進制文件的文件特征與預置的多個二進制文件類簇中的質心二進制文件的文件特征進行對比,確定待分類二進制文件所屬類簇,從而確定待分類二進制文件所屬類簇,所述質心二進制文件代表對應類簇的類簇特征。使得更加快速且準確地對二進制文件進行分類。
技術領域
本申請涉及計算機技術領域,尤其涉及一種二進制文件的分類方法、計算設備及存儲介質。
背景技術
隨著大數據和云計算技術的迅猛發展,伴隨而來的網絡安全局面日益復雜,在大數據海量文件的背景下,人工審計惡意代碼已是捉襟見肘。而相比于文本文件,二進制文件因為缺少大量語義信息導致更加難以提取有效特征。且,二進制文件大小要遠大于文本文件,在海量樣本場景下如何快速分析一直是一個挑戰性問題。
發明內容
本申請的多個方面提供一種二進制文件的分類方法、計算設備及存儲介質,使得更加快速且準確地對二進制文件進行分類。
本申請實施例提供一種二進制文件的分類方法,包括:待分類二進制文件,獲取所述待分類二進制文件中對應的可變化代碼;確定所述可變化代碼的代碼特征,作為待分類二進制文件的文件特征;將所述待分類二進制文件的文件特征與預置的多個二進制文件類簇中的質心二進制文件的文件特征進行對比,確定所述待分類二進制文件所屬類簇,從而確定待分類二進制文件的類簇,所述質心二進制文件代表對應類簇的類簇特征。
本申請實施例還提供一種計算設備,包括:存儲器、處理器;所述存儲器,用于存儲計算機程序;所述處理器,執行所述計算機程序,以用于:獲取待分類二進制文件,獲取所述待分類二進制文件中對應的可變化代碼;確定所述可變化代碼的代碼特征,作為待分類二進制文件的文件特征;將所述待分類二進制文件的文件特征與預置的多個二進制文件類簇中的質心二進制文件的文件特征進行對比,確定所述待分類二進制文件所屬類簇,從而確定待分類二進制文件的類簇,所述質心二進制文件代表對應類簇的類簇特征。
本申請實施例還提供一種存儲有計算機程序的計算機可讀存儲介質,計算機程序被一個或多個處理器執行時,致使所述一個或多個處理器實現上述方法中的步驟。
在本申請實施例中,獲取待分類二進制文件,獲取待分類二進制文件中對應的可變化代碼;確定可變化代碼的代碼特征,作為待分類二進制文件的文件特征;將待分類二進制文件的文件特征與預置的多個二進制文件類簇中的質心二進制文件的文件特征進行對比,確定待分類二進制文件所屬類簇,從而確定待分類二進制文件的類簇,質心二進制文件代表對應類簇的類簇特征。
其中,獲取待分類二進制文件,獲取待分類二進制文件中對應的可變化代碼,可以剔除掉不必要的信息,使得更有針對性地針對可變化代碼進行較為準確且快速的分類,以及代碼的識別。
將文件特征與預置的多個二進制文件類簇中的質心二進制文件的文件特征進行對比,確定待分類二進制文件所屬類簇,從而確定待分類二進制文件的類簇,從而使得以自動化的方式對二進制文件進行分類以及識別。且分類以及識別的速度和準確率都得到了大大的提升。
附圖說明
此處所說明的附圖用來提供對本申請的進一步理解,構成本申請的一部分,本申請的示意性實施例及其說明用于解釋本申請,并不構成對本申請的不當限定。在附圖中:
圖1為本申請一示例性實施例的二進制文件的分類方法的流程示意圖;
圖2為本申請一示例性實施例的二進制文件的分類的過程的示意圖;
圖3為本申請一示例性實施例的二進制文件的分類系統的結構示意圖;
圖4為本申請一示例性實施例提供的二進制文件的分類裝置的結構示意圖;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于阿里云計算有限公司,未經阿里云計算有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202210022273.0/2.html,轉載請聲明來源鉆瓜專利網。





