[發明專利]一種相似性檢測模型的訓練方法及裝置、應用方法及裝置有效
| 申請號: | 202010723891.9 | 申請日: | 2020-07-24 |
| 公開(公告)號: | CN111860662B | 公開(公告)日: | 2023-03-24 |
| 發明(設計)人: | 許靜;高紅燦;過辰楷;黃登蓉;吳彥峰;何振 | 申請(專利權)人: | 南開大學 |
| 主分類號: | G06F18/22 | 分類號: | G06F18/22;G06F18/25;G06N3/0442;G06N3/084 |
| 代理公司: | 北京布瑞知識產權代理有限公司 11505 | 代理人: | 孟潭 |
| 地址: | 300350 天津*** | 國省代碼: | 天津;12 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 相似性 檢測 模型 訓練 方法 裝置 應用 | ||
1.一種相似性檢測模型的訓練方法,其特征在于,包括:
對第一應用程序和第二應用程序的屬性信息進行特征提取,獲得屬性特征;
根據所述屬性特征,獲得所述第一應用程序和所述第二應用程序之間的相似度;
根據所述相似度和相似度標簽的差異,訓練所述相似性檢測模型,其中,所述相似度標簽用于標記所述第一應用程序和所述第二應用程序之間的相似性;所述相似度標簽是基于所述第一應用程序和所述第二應用程序的粗粒度類別信息和/或細粒度類別信息建立的;
所述對第一應用程序和第二應用程序的屬性信息進行特征提取,獲得屬性特征,包括:
將所述第一應用程序的屬性信息和所述第二應用程序的屬性信息拼接后輸入所述相似性檢測模型,通過所述相似性檢測模型對屬性信息進行特征提取,得到所述屬性特征。
2.根據權利要求1所述的方法,其特征在于,所述相似度標簽包括第一相似度標簽、第二相似度標簽和/或第三相似度標簽,其中,所述第一相似度標簽用于標記所述第一應用程序和所述第二應用程序的粗粒度類別信息不同;所述第二相似度標簽用于標記所述第一應用程序和所述第二應用程序的粗粒度類別信息相同且細粒度類別信息不同;所述第三相似度標簽用于標記所述第一應用程序和所述第二應用程序的細粒度類別信息相同。
3.根據權利要求1所述的方法,其特征在于,所述相似性檢測模型為因子分解機FM模型、深度神經網絡DNN模型或深度因子分解機DeepFM模型。
4.根據權利要求1至3中任一項所述的方法,其特征在于,還包括:
對所述第一應用程序和所述第二應用程序的屬性信息進行詞嵌入處理,其中,所述對第一應用程序和第二應用程序的屬性信息進行特征提取,包括:
對所述第一應用程序和所述第二應用程序的經過詞嵌入處理后的屬性信息進行特征提取。
5.根據權利要求4所述的方法,其特征在于,所述屬性信息包括應用程序的標題信息、描述信息和隱私策略信息,所述方法還包括:
通過長短期記憶網絡對所述第一應用程序和所述第二應用程序的經過詞嵌入處理后的所述描述信息和所述隱私策略信息進行預訓練,其中,所述對所述第一應用程序和所述第二應用程序的經過詞嵌入處理后的屬性信息進行特征提取,包括
對所述第一應用程序和所述第二應用程序的經過詞嵌入處理后的標題信息和經過詞嵌入處理與預訓練后的描述信息和隱私策略信息進行特征提取。
6.根據權利要求5所述的方法,其特征在于,所述長短期記憶網絡為單向長短期記憶網絡、雙向長短期記憶網絡、基于注意力機制的單向長短期記憶網絡或基于注意力機制的雙向長短期記憶網絡。
7.一種相似性檢測模型的應用方法,其特征在于,包括:將待檢測的第一應用程序和第二應用程序的屬性信息輸入相似性檢測模型,其中所述相似性檢測模型通過上述權利要求1至6中任一項所述的方法訓練得到;
利用所述相似性檢測模型對所述第一應用程序和所述第二應用程序進行相似性檢測。
8.一種相似性檢測模型的訓練裝置,其特征在于,包括:
特征提取模塊,用于對第一應用程序和第二應用程序的屬性信息進行特征提取,獲得屬性特征;
相似度模塊,用于根據所述屬性特征,獲得所述第一應用程序和所述第二應用程序之間的相似度;
訓練模塊,用于根據所述相似度和相似度標簽的差異,訓練所述相似性檢測模型,其中,所述相似度標簽用于標記所述第一應用程序和所述第二應用程序之間的相似性;所述相似度標簽是基于所述第一應用程序和所述第二應用程序的粗粒度類別信息和/或細粒度類別信息建立的;
所述對第一應用程序和第二應用程序的屬性信息進行特征提取,獲得屬性特征,包括:
將所述第一應用程序的屬性信息和所述第二應用程序的屬性信息拼接后輸入所述相似性檢測模型,通過所述相似性檢測模型對屬性信息進行特征提取,得到所述屬性特征。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于南開大學,未經南開大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010723891.9/1.html,轉載請聲明來源鉆瓜專利網。





