[發明專利]一種相似性檢測模型的訓練方法及裝置、應用方法及裝置有效
| 申請號: | 202010723891.9 | 申請日: | 2020-07-24 |
| 公開(公告)號: | CN111860662B | 公開(公告)日: | 2023-03-24 |
| 發明(設計)人: | 許靜;高紅燦;過辰楷;黃登蓉;吳彥峰;何振 | 申請(專利權)人: | 南開大學 |
| 主分類號: | G06F18/22 | 分類號: | G06F18/22;G06F18/25;G06N3/0442;G06N3/084 |
| 代理公司: | 北京布瑞知識產權代理有限公司 11505 | 代理人: | 孟潭 |
| 地址: | 300350 天津*** | 國省代碼: | 天津;12 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 相似性 檢測 模型 訓練 方法 裝置 應用 | ||
本發明提供了一種相似性檢測模型的訓練方法及裝置、應用方法及裝置。該訓練方法包括:對第一應用程序和第二應用程序的屬性信息進行特征提取,獲得屬性特征;根據屬性特征,獲得第一應用程序和第二應用程序之間的相似度;根據相似度和相似度標簽的差異,訓練相似性檢測模型,其中,相似度標簽用于標記第一應用程序和第二應用程序之間的相似性,能夠利用相似度標簽作為訓練標簽,建立有監督的相似性檢測模型,提高相似性檢測模型的性能,從而提高應用程序相似性的檢測效率和準確性。
技術領域
本發明涉及深度學習技術領域,具體涉及一種相似性檢測模型的訓練方法及裝置、訓練方法及裝置。
背景技術
應用程序(Application,APP)相似性檢測是軟件工程的重要組成部分,被廣泛的應用于惡意軟件檢測、APP推薦和軟件需求發現等領域。
目前,對APP進行相似性檢測的方法主要包括水印法和特征提取法。水印法是將特定的數據(如文字和字符串秘鑰等)作為水印添加到APP中,在檢測時利用相應算法從APP中提取水印,然后根據提取的水印結果對APP的相似性進行判斷。特征提取法是通過對APP的屬性進行分析,生成特征向量,并通過距離計算獲取相似特征向量之間的相似性或對特征向量進行分類。
然而,現有相似性檢測方法的檢測效率較低、準確性較低。
發明內容
有鑒于此,本發明實施例提供了一種相似性檢測模型的訓練方法及裝置、訓練方法及裝置,能夠提高應用程序相似性的檢測效率和準確性。
根據本發明實施例的第一方面,提供一種相似性檢測模型的訓練方法,包括:對第一應用程序和第二應用程序的屬性信息進行特征提取,獲得屬性特征;根據屬性特征,獲得第一應用程序和第二應用程序之間的相似度;根據相似度和相似度標簽的差異,訓練相似性檢測模型,其中,相似度標簽用于標記第一應用程序和第二應用程序之間的相似性。
在本發明的一些實施例中,相似度標簽是基于第一應用程序和第二應用程序的粗粒度類別信息和/或細粒度類別信息建立的。
在本發明的一些實施例中,相似度標簽包括第一相似度標簽、第二相似度標簽和/或第三相似度標簽,其中,第一相似度標簽用于標記第一應用程序和第二應用程序的粗粒度類別信息不同;第二相似度標簽用于標記第一應用程序和第二應用程序的粗粒度類別信息相同且細粒度類別信息不同;第三相似度標簽用于標記第一應用程序和第二應用程序的細粒度類別信息相同。
在本發明的一些實施例中,相似性檢測模型為FM模型、DNN模型或DeepFM模型。
在本發明的一些實施例中,上述相似性檢測模型的訓練方法還包括:對第一應用程序和第二應用程序的屬性信息進行詞嵌入處理,其中,上述對第一應用程序和第二應用程序的屬性信息進行特征提取,包括:對第一應用程序和第二應用程序的經過詞嵌入處理后的屬性信息進行特征提取。
在本發明的一些實施例中,屬性信息包括應用程序的標題信息、描述信息和隱私策略信息,上述相似性檢測模型的訓練方法還包括:通過長短期記憶網絡對第一應用程序和第二應用程序的經過詞嵌入處理后的描述信息和隱私策略信息進行預訓練,其中,上述對第一應用程序和第二應用程序的經過詞嵌入處理后的屬性信息進行特征提取,包括:對第一應用程序和第二應用程序的經過詞嵌入處理后的標題信息和經過詞嵌入處理與預訓練后的描述信息和隱私策略信息進行特征提取。
在本發明的一些實施例中,長短期記憶網絡為單向長短期記憶網絡、雙向長短期記憶網絡、基于注意力機制的單向長短期記憶網絡或基于注意力機制的雙向長短期記憶網絡。
根據本發明實施例的第二方面,提供一種相似性檢測模型的應用方法,包括:將待檢測的第一應用程序和第二應用程序的屬性信息輸入相似性檢測模型,其中相似性檢測模型通過上述任一所述的方法訓練得到;利用相似性檢測模型對第一應用程序和第二應用程序進行相似性檢測。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于南開大學,未經南開大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010723891.9/2.html,轉載請聲明來源鉆瓜專利網。





