[發明專利]基于重點關鍵詞的關鍵詞拓展方法和裝置有效
| 申請號: | 201711227953.1 | 申請日: | 2017-11-29 |
| 公開(公告)號: | CN108170664B | 公開(公告)日: | 2021-04-09 |
| 發明(設計)人: | 翁永金;李百川;陳第;蔡銳濤;李展鏗 | 申請(專利權)人: | 有米科技股份有限公司 |
| 主分類號: | G06F16/951 | 分類號: | G06F16/951;G06F16/9035 |
| 代理公司: | 廣州華進聯合專利商標代理有限公司 44224 | 代理人: | 馮右明 |
| 地址: | 511400 廣東省廣州市番*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 重點 關鍵詞 拓展 方法 裝置 | ||
1.一種基于重點關鍵詞的關鍵詞拓展方法,其特征在于,包括:
獲取待拓展APP覆蓋的第一級關鍵詞,從中篩選出重點關鍵詞;
根據各個重點關鍵詞在應用庫平臺搜索到的APP,得到待拓展APP關聯的第二級APP;獲取各第二級APP覆蓋的關鍵詞,根據全部第二級APP覆蓋的關鍵詞得到一候選關鍵詞集合;
根據候選關鍵詞集合中各關鍵詞與對應重點關鍵詞的相似度,確定候選關鍵詞集合中各關鍵詞相對于重點關鍵詞的綜合相似度;包括:獲取候選關鍵詞集合中各關鍵詞對應的重點關鍵詞、各關鍵詞與對應重點關鍵詞的相似度;獲取候選關鍵詞集合中各關鍵詞與對應的重點關鍵詞的相似度的步驟,該步驟包括:
根據候選關鍵詞集合中每個關鍵詞搜索到的APP得到每個關鍵詞的特征向量,根據每個重點關鍵詞搜索到的APP得到每個重點關鍵詞的特征向量;
將候選關鍵詞集合中各關鍵詞的特征向量分別與對應重點關鍵詞的特征向量進行One-Hot編碼處理,得到候選關鍵詞集合中所述關鍵詞的稀疏特征向量以及對應重點關鍵詞的稀疏特征向量;
根據候選關鍵詞集合中所述關鍵詞的稀疏特征向量以及對應重點關鍵詞的稀疏特征向量,計算候選關鍵詞集合中所述關鍵詞與對應重點關鍵詞的相似度;
根據候選關鍵詞集合中各個關鍵詞在該關鍵詞對應的第二級APP中的重要度,獲取候選關鍵詞集合中各個關鍵詞所占的比重;根據所述比重以及所述綜合相似度計算候選關鍵詞集合中各關鍵詞的相似度得分;
根據所述相似度得分對所述候選關鍵詞集合進行篩選,得到待拓展APP的關聯關鍵詞;
其中,APP覆蓋的關鍵詞需滿足條件:在該關鍵詞對應的搜索結果中包含有所述APP。
2.根據權利要求1所述的基于重點關鍵詞的關鍵詞拓展方法,其特征在于,所述從中篩選出重點關鍵詞,包括:
獲取各個第一級關鍵詞對于待拓展APP的重要度,選取重要度大于或等于第一設定重要度閾值的第一級關鍵詞,作為待拓展APP覆蓋的重點關鍵詞;
其中,關鍵詞對于待拓展APP的重要度,表征待拓展APP在該關鍵詞的搜索結果中的排名信息。
3.根據權利要求2所述的基于重點關鍵詞的關鍵詞拓展方法,其特征在于,所述根據各個重點關鍵詞在應用庫平臺搜索到的APP,得到待拓展APP關聯的第二級APP,包括:
根據歷史搜索記錄中各重點關鍵詞在設定歷史時段內的多次搜索結果,得到所述重點關鍵詞對應的多次搜索結果中APP的頻次排序信息;獲取頻次排序排在前的設定數量的APP,作為所述重點關鍵詞搜索到的APP;
根據全部重點關鍵詞、各個重點關鍵詞搜索到的APP得到一APP矩陣;統計所述APP矩陣中各APP的出現頻次,選取所述APP矩陣中出現頻次大于或等于設定頻次的APP,作為待拓展APP關聯的第二級APP。
4.根據權利要求3所述的基于重點關鍵詞的關鍵詞拓展方法,其特征在于,在得到待拓展APP關聯的第二級APP之后,獲取各第二級APP覆蓋的關鍵詞之前,還包括:
獲取待拓展APP在應用庫平臺中所屬的應用榜單,刪除與待拓展APP屬于不同應用榜單的第二級APP。
5.根據權利要求1所述的基于重點關鍵詞的關鍵詞拓展方法,其特征在于,
根據候選關鍵詞集合中各關鍵詞與對應重點關鍵詞的相似度,確定候選關鍵詞集合中各關鍵詞相對于重點關鍵詞的綜合相似度,還包括:
計算候選關鍵詞集合中各關鍵詞與對應的重點關鍵詞的相似度的平均值,作為候選關鍵詞集合中各關鍵詞相對于重點關鍵詞的綜合相似度。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于有米科技股份有限公司,未經有米科技股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201711227953.1/1.html,轉載請聲明來源鉆瓜專利網。





