[發明專利]用于識別壓縮文件子類型的方法、病毒檢測方法及裝置在審
| 申請號: | 201610229011.6 | 申請日: | 2016-04-13 |
| 公開(公告)號: | CN107292171A | 公開(公告)日: | 2017-10-24 |
| 發明(設計)人: | 邱克生 | 申請(專利權)人: | 阿里巴巴集團控股有限公司 |
| 主分類號: | G06F21/56 | 分類號: | G06F21/56;G06F17/30 |
| 代理公司: | 北京市清華源律師事務所11441 | 代理人: | 沈泳,王永秀 |
| 地址: | 英屬開曼群島大開*** | 國省代碼: | 暫無信息 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 用于 識別 壓縮文件 類型 方法 病毒 檢測 裝置 | ||
技術領域
本申請涉及文件類型識別領域,具體涉及一種用于識別壓縮文件子類型的方法及裝置。本申請同時涉及一種用于壓縮文件的病毒檢測方法及裝置。
背景技術
在很多計算機與互聯網應用中,為了執行與文件相關的處理操作,通常需要先識別文件類型。傳統的文件類型識別,往往用待識別文件頭部的特征串與符合某種文件類型的預設特征串進行匹配,若成功則輸出相應的文件類型。比如,Zip壓縮格式的特征串為“PK”,當一個文件頭部特征串為“PK”時,通常認為該文件是Zip格式的文件,簡稱Zip文件。
由于許多應用采用壓縮格式作為文件的封裝容器,因此壓縮文件通常還具有相應的子類型。以Zip文件為例,office的docx、xlsx、pptx文件,安卓的apk文件,蘋果ios的ipa文件,java程序包jar文件等等,雖然都采用了Zip壓縮格式,但他們各自有不同的用途和內部格式,這種內部格式稱為子類型,而Zip僅僅是這些子類型的封裝容器而已。
在實際應用中,僅僅識別出壓縮文件是不夠的,有時還需要進一步識別出壓縮文件的子類型。例如,在計算機反病毒技術中,為了提高檢測效率,需要識別壓縮文件的子類型,然后根據識別出的子類型,判斷是否需要進行病毒檢測、并在需要時調用針對相應子類型的掃描引擎進行病毒檢測。
目前為了識別壓縮文件子類型,通常需要將壓縮文件解壓縮,然后再對解壓后的文件進行類型識別從而達到識別壓縮文件子類型的目的。顯然,由于需要執行解壓縮操作,而解壓縮操作通常比較耗費CPU資源,因此整個識別過程耗時長,性能低下,有時甚至無法滿足應用的實時處理需求。
發明內容
本申請實施例提供一種用于識別壓縮文件子類型的方法和裝置,以解決現 有的壓縮文件子類型識別方法耗時長、性能低下的問題。本申請實施例還提供一種用于壓縮文件的病毒檢測方法和裝置。
本申請提供一種用于識別壓縮文件子類型的方法,包括:
獲取預設的壓縮文件子類型特征串集合;
將所述壓縮文件子類型特征串集合中的特征串與待識別壓縮文件包含的文件路徑名進行匹配,并根據匹配結果以及預設的特征串與子類型的對應關系、確定所述待識別壓縮文件的子類型。
可選的,所述壓縮文件子類型特征串集合包括:Zip文件子類型特征串集合;所述待識別壓縮文件包括:待識別Zip文件。
可選的,所述將所述壓縮文件子類型特征串集合中的特征串與待識別壓縮文件包含的文件路徑名進行匹配,并根據匹配結果以及預設的特征串與子類型的對應關系、確定所述待識別壓縮文件的子類型,包括:
將所述Zip文件子類型特征串集合中的特征串與所述待識別Zip文件包含的文件路徑名逐一進行匹配,當其中任一次匹配成功時,將匹配成功的特征串對應的子類型作為所述待識別Zip文件的子類型。
可選的,所述將所述Zip文件子類型特征串集合中的特征串與所述待識別文件包含的文件路徑名逐一進行匹配,當其中任一次匹配成功時,將匹配成功的特征串對應的子類型作為所述待識別Zip文件的子類型,包括:
針對所述Zip文件子類型特征串集合中的每個特征串,執行下述操作:
定位到所述待識別Zip文件的首個特定記錄;
判斷當前定位的特定記錄是否符合Zip文件格式定義,若不符合結束所述特征串的匹配操作,否則獲取當前定位的特定記錄包含的文件路徑名,并將獲取的文件路徑名與所述特征串進行匹配;
若匹配成功,將所述特征串對應的子類型作為所述待識別Zip文件的子類型,并結束本方法的執行;
否則,定位到下一個特定記錄,并轉到所述判斷所述當前特定記錄是否符合Zip文件格式定義的步驟執行。
可選的,所述特定記錄包括:子文件壓縮記錄;
所述定位到所述待識別Zip文件的首個特定記錄,包括:定位到所述待識別 Zip文件的首個子文件壓縮記錄。
可選的,所述特定記錄包括:子文件目錄記錄;
所述定位到所述待識別Zip文件的首個特定記錄,包括:定位到所述待識別Zip文件的首個子文件目錄記錄。
可選的,所述定位到所述待識別Zip文件的首個子文件目錄記錄,包括:
查找位于所述待識別Zip文件尾部的目錄結束記錄;
根據找到的所述目錄結束記錄包含的子文件目錄偏移信息,定位到所述待識別文件的首個子文件目錄記錄。
可選的,所述判斷當前定位的特定記錄是否符合Zip文件格式定義,包括:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于阿里巴巴集團控股有限公司,未經阿里巴巴集團控股有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201610229011.6/2.html,轉載請聲明來源鉆瓜專利網。





