[發明專利]一種app分類系統有效
| 申請號: | 202110197951.2 | 申請日: | 2021-02-22 |
| 公開(公告)號: | CN113010671B | 公開(公告)日: | 2022-04-29 |
| 發明(設計)人: | 俞鋒鋒;呂繁榮;陳津來;姚建明;李柳音 | 申請(專利權)人: | 杭州西湖數據智能研究院 |
| 主分類號: | G06F16/35 | 分類號: | G06F16/35;G06K9/62 |
| 代理公司: | 北京鍾維聯合知識產權代理有限公司 11579 | 代理人: | 丁慧玲 |
| 地址: | 310012 浙江省杭州市西*** | 國省代碼: | 浙江;33 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 app 分類 系統 | ||
1.一種app分類系統,其特征在于,
包括預設的第一數據庫、第二數據庫、第一向量生成模型、第二向量生成模型、分類模型、處理器和存儲有計算機程序的存儲器,其中,所述第一數據庫中存儲有多條app的描述信息記錄,所述app的描述信息記錄包括app id和對應的app描述信息,所述app描述信息為文本信息;所述第二數據庫中存儲有多條app安裝序列,所述app安裝序列基于對應的設備上安裝的app的id按照安裝時間先后順序排序得到;所述app id是app的唯一id,同一app在所述第一數據庫和第二數據庫中的app id相同;所述第一向量生成模型生成預設M維度的第一向量,所述二向量生成模型生成預設N維度的第二向量,當所述計算機程序被處理器執行時,實現以下步驟:
步驟S1、獲取待分類app id,基于所述待分類app id并行執行步驟S2和步驟S3;
步驟S2、基于所述待分類app id判斷所述第一數據庫中是否存在對應的描述信息,若存在,將待分類app id對應的描述信息輸入所述第一向量生成模型中生成待處理第一向量,否則,直接生成每一維度均為0的待處理第一向量;
步驟S3、基于所述待分類app id從所述第二數據庫中隨機獲取預設X個app安裝序列,將所述X個app安裝序列輸入所述第二向量生成模型中生成待處理第二向量;
步驟S4、將所述待處理第一向量和待處理第二向量拼接生成待處理輸入向量;
步驟S5、將所述待處理輸入向量輸入所述分類模型中,輸出待分類app id對應的app類別。
2.根據權利要求1所述的系統,其特征在于,
還包括訓練樣本數據集,包括多個已標注app類別的app id訓練樣本,當所述計算機程序被處理器執行時,還實現步驟S10、訓練得到所述分類模型,具體包括:
步驟S101、從所述訓練樣本數據集中獲取A個訓練樣本,從所述第一數據庫中獲取A個訓練樣本對應的描述信息,將每一訓練樣本對應的描述信息輸入第一向量生成模型中得到對應的第一向量;
步驟S102、從所述訓練樣本數據集中獲取B個訓練樣本,從所述第二數據庫中獲取預設Y個app安裝序列,并將所述Y個app安裝序列輸入所述第二向量生成模型中獲取B個訓練樣本中每一訓練樣本對應的第二向量,其中,B大于A,且所述B個訓練樣本中包括所述A個訓練樣本;
步驟S103、判斷所述B個訓練樣本中每一訓練樣本是否存在對應的第一向量,若存在,則將訓練樣本對應的第一向量和第二向量拼接生成訓練樣本對應的輸入向量,若不存在,則為訓練樣本生成每一維度均為0的第一向量并與對應的第二向量拼接,生成訓練樣本對應的輸入向量;
步驟S104、每一訓練樣本對應的預設的R維度分類向量的實際app別對應的維度設置為1,其它維度設置為0,得到每一訓練樣本對應的實際分類向量,將B個訓練樣本對應的輸入向量輸入預設的分類模型中,得到每一訓練樣本對應的預測分類向量;
步驟S105、基于B個訓練樣本對應的預測分類向量和實際分類向量計算損失函數,并基于損失函數判斷當前分類模型是否達到預設精度,若達到,則結束訓練,否則,基于當前損失函數調整分類模型的模型參數,并返回步驟S101。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于杭州西湖數據智能研究院,未經杭州西湖數據智能研究院許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110197951.2/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:具有糞便提示功能的嬰兒紙尿褲
- 下一篇:多模態視頻檢索系統





