[發明專利]一種RTF文件的解析方法及裝置有效
| 申請號: | 201910121409.1 | 申請日: | 2019-02-19 |
| 公開(公告)號: | CN109871685B | 公開(公告)日: | 2023-08-08 |
| 發明(設計)人: | 姜澎;于濤;郭曉龍;屈亞鑫;張友旭;任光輝;畢磊;申金娟;吳彬;蘇蒙;崔精兵;郭長宇;趙子云;王玥 | 申請(專利權)人: | 騰訊科技(深圳)有限公司 |
| 主分類號: | G06F21/56 | 分類號: | G06F21/56;G06F16/903 |
| 代理公司: | 北京同達信恒知識產權代理有限公司 11291 | 代理人: | 郭潤湘;李娟 |
| 地址: | 518044 廣東省深圳*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 rtf 文件 解析 方法 裝置 | ||
1.一種RTF文件的解析方法,其特征在于,包括:
獲取待解析RTF文件;
將所述待解析RTF文件中的字符與所述RTF文件對應的有效標簽集合進行比對,確定所述待解析RTF文件中的有效標簽;
去除所述待解析RTF文件中的有效標簽;
根據所述待解析RTF文件中子文件的屬性信息,確定預設字符;
將所述預設字符與去除所述有效標簽的待解析RTF文件進行比對,確定所述待解析RTF文件中的有效字符;
過濾所述去除所述有效標簽的待解析RTF文件中除所述有效字符之外的混淆字符,生成目標文件;
將預設頭部標識與所述目標文件中的字符進行匹配;
在確定所述目標文件中包含與所述預設頭部標識匹配的字符時,從所述目標文件中確定出所述預設頭部標識對應的域操作符;
將所述預設頭部標識對應的域操作符內的字符確定為目標子文件。
2.如權利要求1所述的方法,其特征在于,還包括:
將所述目標文件轉化為二進制格式的文件。
3.如權利要求1或2所述的方法,其特征在于,所述將所述預設頭部標識對應的域操作符內的字符確定為目標子文件之后,還包括:
對所述目標子文件進行邏輯檢測;
在確定所述目標子文件滿足預設邏輯時,將所述目標子文件確定為正常文件,否則,將所述目標子文件確定為惡意文件。
4.如權利要求3所述的方法,其特征在于,所述獲取待解析RTF文件,包括:
識別待解析文件的文件類型;
在確定所述待解析文件的文件類型為RTF文件時,獲取待解析RTF文件。
5.一種RTF文件的解析裝置,其特征在于,包括:
獲取模塊,用于待解析RTF文件;
處理模塊,用于將所述待解析RTF文件中的字符與所述RTF文件對應的有效標簽集合進行比對,確定所述待解析RTF文件中的有效標簽;去除所述待解析RTF文件中的有效標簽;根據所述待解析RTF文件中子文件的屬性信息,確定預設字符;將所述預設字符與去除所述有效標簽的待解析RTF文件進行比對,確定所述待解析RTF文件中的有效字符;過濾所述去除所述有效標簽的待解析RTF文件中除所述有效字符之外的混淆字符,生成目標文件;
匹配模塊,用于將預設頭部標識與所述目標文件中的字符進行匹配;在確定所述目標文件中包含與所述預設頭部標識匹配的字符時,從所述目標文件中確定出所述預設頭部標識對應的域操作符;
解析模塊,用于將所述預設頭部標識對應的域操作符內的字符確定為目標子文件。
6.如權利要求5所述的裝置,其特征在于,所述處理模塊還用于:
將所述目標文件轉化為二進制格式的文件。
7.一種終端設備,其特征在于,包括至少一個處理單元、以及至少一個存儲單元,其中,所述存儲單元存儲有計算機程序,當所述程序被所述處理單元執行時,使得所述處理單元執行權利要求1~4任一權利要求所述方法的步驟。
8.一種計算機可讀介質,其特征在于,其存儲有可由終端設備執行的計算機程序,當所述程序在終端設備上運行時,使得所述終端設備執行權利要求1~4任一所述方法的步驟。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于騰訊科技(深圳)有限公司,未經騰訊科技(深圳)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910121409.1/1.html,轉載請聲明來源鉆瓜專利網。





