[發明專利]基于CNN的應用程序行業分類方法、存儲介質及終端有效
| 申請號: | 201910048882.1 | 申請日: | 2019-01-18 |
| 公開(公告)號: | CN109816005B | 公開(公告)日: | 2021-08-03 |
| 發明(設計)人: | 廖興龍 | 申請(專利權)人: | 北京智游網安科技有限公司 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62;G06N3/04 |
| 代理公司: | 深圳市君勝知識產權代理事務所(普通合伙) 44268 | 代理人: | 王永文;劉文求 |
| 地址: | 100000 北京市海淀區東北旺西路8*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 cnn 應用程序 行業 分類 方法 存儲 介質 終端 | ||
1.一種基于CNN的應用程序行業分類方法,其特征在于,其包括:
獲取各應用程序的主頁面圖片,并將獲取到的主頁面圖片劃分為第一主頁面圖片集和第二主頁面圖片集,其中,所述第一主頁面圖片集包含第一預設數量的主頁面圖片;
通過預設的增強算法將獲取到的第一主頁面圖片集擴大至第二預設數量的第三主頁面圖片集;
根據深度學習算法和所述第三主頁面圖片集構建行業關系模型;
根據所述行業關系模型對第二主頁面圖片集進行分類,以對第二主頁面圖片集中各主頁面圖片對應的應用程序進行行業分類;
所述第一主頁面圖片集包含第一預設數量的主頁面圖片具體包括:
選取第三預設數量的行業類型,并在各行業類型下選取第四預設數量的應用程序;
所述第三預設數量的行業類型下的第四預設數量的應用程序的主頁面圖片構成了第一主頁面圖片集;
所述根據所述行業關系模型對第二主頁面圖片集進行分類,以對第二主頁面圖片集中各主頁面圖片對應的應用程序進行行業分類具體包括:
獲取主頁面圖片與行業類型的行業關系模型;
根據所述行業關系模型對第二主頁面圖片集中各主頁面圖片進行分類;
根據各主頁面圖片的分類,進而對各主頁面圖片對應的應用程序進行行業分類;
所述預設的增強算法具體包括:
對圖片進行旋轉90度,旋轉180度,旋轉270度,鏡像,平移,改變亮度,改變對比度,色彩調整,加入噪聲中的一種或者多種;
所述根據深度學習算法和所述第三主頁面圖片集構建行業關系模型具體包括:
將第三主頁面圖片集按照預設的比例劃分為訓練集、測試集和驗證集;
根據深度學習算法和劃分后的訓練集、測試集和驗證集生成行業關系模型;
所述根據深度學習算法和劃分后的訓練集、測試集和驗證集生成行業關系模型具體包括:
增加深度學習算法對劃分后的訓練集、測試集和驗證集的運行次數,以減少測試集和驗證集的損失;
當損失降至最低時,保存生成的行業關系模型;
所述獲取各應用程序的主頁面圖片還包括:
獲取各應用程序的包名,并建立各應用程序的主頁面圖片與包名的對應關系。
2.根據權利要求1所述基于CNN的應用程序行業分類方法,其特征在于,所述深度學習算法為LeNet-5深度學習算法。
3.一種計算機可讀存儲介質,其特征在于,所述計算機可讀存儲介質存儲有一個或者多個程序,所述一個或者多個程序可被一個或者多個處理器執行,以實現如權利要求1~2任意一項所述的基于CNN的應用程序行業分類方法中的步驟。
4.一種終端設備,其特征在于,包括:處理器和存儲器;所述存儲器上存儲有可被所述處理器執行的計算機可讀程序;所述處理器執行所述計算機可讀程序時實現如權利要求1~2任意一項所述的基于CNN的應用程序行業分類方法中的步驟。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京智游網安科技有限公司,未經北京智游網安科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910048882.1/1.html,轉載請聲明來源鉆瓜專利網。





