[發明專利]關鍵詞推薦方法及設備在審
| 申請號: | 201810086544.2 | 申請日: | 2018-01-29 |
| 公開(公告)號: | CN108108497A | 公開(公告)日: | 2018-06-01 |
| 發明(設計)人: | 張昭 | 申請(專利權)人: | 上海名軒軟件科技有限公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30;G06F17/27;G06Q30/06 |
| 代理公司: | 上海百一領御專利代理事務所(普通合伙) 31243 | 代理人: | 甘章乖;王路豐 |
| 地址: | 201203 上海市浦東新區自由貿*** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 候選關鍵詞 商品描述信息 關鍵詞推薦 可用性 搜索數據 相關度 相似度 衡量 保證 | ||
1.一種關鍵詞推薦方法,其中,該方法包括:
獲取待推薦關鍵詞的商品描述信息及其對應的類目;
將所述待推薦關鍵詞的商品描述信息進行拆分得到對應的分詞片段;
從關鍵詞詞庫獲取所述類目中包含所述分詞片段的候選關鍵詞,及獲取所述候選關鍵詞與所述類目的相關性分數,和獲取所述候選關鍵詞的搜索數據;
將所述候選關鍵詞進行拆分得到對應的分詞片段;
根據所述商品描述信息所拆分得到的分詞片段,得到所述商品描述信息的向量,及根據所述候選關鍵詞所拆分得到的分詞片段,得到所述候選關鍵詞的向量;
根據所述商品描述信息的向量和候選關鍵詞的向量計算所述商品描述信息與每一個候選關鍵詞的相似度;
根據所述相似度、相關性分數和搜索數據計算各個候選關鍵詞的綜合分值;
獲取綜合分值大于預設閾值的候選關鍵詞。
2.根據權利要求1所述的方法,其中,根據所述商品描述信息所拆分得到的分詞片段,得到所述商品描述信息的向量,及根據所述候選關鍵詞所拆分得到的分詞片段,得到所述候選關鍵詞的向量,包括:
將所述商品描述信息所拆分得到的分詞片段和所述候選關鍵詞所拆分得到的分詞片段進行合并,得到分詞語料;
利用所述分詞語料創建向量化模型,基于所述創建向量化模型分別得到所述商品描述信息的向量和候選關鍵詞的向量。
3.根據權利要求1或2所述的方法,其中,將所述待推薦關鍵詞的商品描述信息進行拆分得到對應的分詞片段,包括:
將所述待推薦關鍵詞的商品描述信息進行拆分得到對應的分詞片段和每個分詞片段對應的詞性;
將所述候選關鍵詞進行拆分得到對應的分詞片段,包括:
將所述候選關鍵詞進行拆分得到對應的分詞片段和每個分詞片段對應的詞性;
根據所述商品描述信息所拆分得到的分詞片段,得到所述商品描述信息的向量,及根據所述候選關鍵詞所拆分得到的分詞片段,得到所述候選關鍵詞的向量,包括:
根據所述商品描述信息所拆分得到的分詞片段,得到所述商品描述信息的初始向量,及根據所述候選關鍵詞所拆分得到的分詞片段,得到的所述候選關鍵詞的初始向量;
獲取所述商品描述信息和候選關鍵詞中各個分詞片段對應的詞性所對應的權重;
根據對應的權重分別對所述商品描述信息的初始向量和候選關鍵詞的初始向量進行調整,得到調整后的商品描述信的向量和候選關鍵詞的向量。
4.根據權利要求3所述的方法,其中,根據所述商品描述信息的向量和候選關鍵詞的向量計算所述商品描述信息與每一個候選關鍵詞的相似度,包括:
利用預設的兩個相關性分數算法,分別計算調整后的商品描述信的向量和候選關鍵詞的向量的相似度分數。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于上海名軒軟件科技有限公司,未經上海名軒軟件科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810086544.2/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:根據網頁創建播放列表
- 下一篇:一種基于互聯網的大數據查詢系統





