[發明專利]缺陷檢測方法、裝置及服務終端有效
| 申請號: | 201710291779.0 | 申請日: | 2017-04-28 |
| 公開(公告)號: | CN107066302B | 公開(公告)日: | 2019-11-05 |
| 發明(設計)人: | 李祺;張少東;孫博文;郭燕慧 | 申請(專利權)人: | 北京郵電大學 |
| 主分類號: | G06F8/53 | 分類號: | G06F8/53;G06F11/36 |
| 代理公司: | 北京超凡志成知識產權代理事務所(普通合伙) 11371 | 代理人: | 馬維麗 |
| 地址: | 100876 *** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 缺陷檢測 應用程序 向量 服務終端 綜合特征 安裝包 詞頻 字節碼文件 特征向量 語義特征 缺陷檢測裝置 互聯網技術 源代碼文件 向量設置 檢測 拼接 編譯 應用 分析 | ||
1.一種缺陷檢測方法,所述缺陷檢測方法應用于服務終端,所述缺陷檢測方法應用于對應用程序進行缺陷檢測,其特征在于,所述方法包括:
對所述應用程序的安裝包進行反編譯得到字節碼文件;
生成所述字節碼文件的結構樹;
通過語義提取算法遍歷所述結構樹,將所述結構樹每一節點的詞編譯為預定數值;
將多個所述預定數值按照預定的結構排列形成語義特征向量;
遍歷所述字節碼文件提取詞頻特征向量;
對所述詞頻特征向量和所述語義特征向量進行拼接得到綜合特征向量;
將所述綜合特征向量設置為預定長度;
使用缺陷檢測模型對設置為預定長度后的所述綜合特征向量進行缺陷檢測以判斷所述應用程序是否存在缺陷。
2.如權利要求1所述的缺陷檢測方法,其特征在于,所述遍歷所述字節碼文件提取詞頻特征向量的步驟包括:
統計所述字節碼文件中每一個詞出現的次數;
每一個所述詞出現的次數與總次數的比例依次排列為所述詞頻特征向量。
3.如權利要求1所述的缺陷檢測方法,其特征在于,所述使用所述缺陷檢測模型對設置為預定長度后的所述綜合特征向量進行缺陷檢測以判斷所述應用程序是否存在缺陷之前還包括步驟:
預設檢測模型;
對所述檢測模型進行訓練得到所述缺陷檢測模型。
4.如權利要求2所述的缺陷檢測方法,其特征在于,對所述檢測模型進行訓練得到所述缺陷檢測模型的步驟包括:
獲取多個檢測樣本,所述檢測樣本包括多個應用程序的源代碼文件及其所述源代碼文件對應的樣本安裝包;
對多個源代碼文件進行掃描以判斷所述多個源代碼文件是否有缺陷,對存在缺陷的源代碼文件標記缺陷標記,對不存在缺陷的源代碼文件標記無缺陷標記;
對多個樣本安裝包進行反編譯得到多個樣本字節碼文件;
遍歷每一個所述樣本字節碼文件提取樣本語義特征向量以及樣本詞頻特征向量;
將每一個所述樣本字節碼文件的樣本語義特征向量以及樣本詞頻特征向量進行拼接得到多個樣本綜合特征向量;
將所述多個樣本綜合特征向量設置為預定長度;
使用設置為預定長度的所述多個樣本綜合特征向量以及標記的所述多個源代碼文件對所述檢測模型進行訓練得到缺陷檢測模型。
5.如權利要求1所述的缺陷檢測方法,其特征在于,所述方法還包括:
獲取所述應用程序的安裝包。
6.一種缺陷檢測裝置,所述缺陷檢測裝置應用于服務終端,所述缺陷檢測裝置應用于對應用程序進行缺陷檢測,其特征在于,所述裝置包括:
第一編譯模塊,用于對所述應用程序的安裝包進行反編譯得到字節碼文件;
第一提取模塊,用于生成所述字節碼文件的結構樹,通過語義提取算法遍歷所述結構樹,將所述結構樹每一節點的詞編譯為預定數值,將多個所述預定數值按照預定的結構排列形成語義特征向量;所述第一提取模塊還用于遍歷所述字節碼文件提取詞頻特征向量;
第一拼接模塊,用于對所述詞頻特征向量和所述語義特征向量進行拼接得到綜合特征向量;
第一設置模塊,用于將所述綜合特征向量設置為預定長度;
檢測模塊,用于使用缺陷檢測模型對設置為預定長度的所述綜合特征向量進行缺陷檢測以判斷所述應用程序是否存在缺陷。
7.如權利要求6所述的缺陷檢測裝置,其特征在于,所述裝置還包括:
預設模塊,用于預設檢測模型;
第一訓練模塊,用于對所述檢測模型進行訓練得到所述缺陷檢測模型。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京郵電大學,未經北京郵電大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710291779.0/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種冷風機參數配置優化方法
- 下一篇:一種脈沖磁場發生器及其工作方法





