[發明專利]商品相似度計算方法及裝置、存儲介質、電子設備有效
| 申請號: | 201710953390.8 | 申請日: | 2017-10-13 |
| 公開(公告)號: | CN109670161B | 公開(公告)日: | 2023-01-31 |
| 發明(設計)人: | 朱遠昌 | 申請(專利權)人: | 北京京東尚科信息技術有限公司;北京京東世紀貿易有限公司 |
| 主分類號: | G06F16/9536 | 分類號: | G06F16/9536;G06F40/289;G06N3/04;G06Q30/06 |
| 代理公司: | 北京律智知識產權代理有限公司 11438 | 代理人: | 王輝;闞梓瑄 |
| 地址: | 100195 北京市海淀區杏石口路6*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 商品 相似 計算方法 裝置 存儲 介質 電子設備 | ||
本公開是關于一種商品相似度計算方法及裝置,屬于數據處理技術領域,該方法包括:利用第一機器學習模型對多個標題詞進行學習得到多個與各標題詞關聯的分布式向量表示;利用第二機器學習模型對各分布式向量表示以及歷史商品相似度進行學習得到各標題詞之間的相似度;根據各標題詞之間的相似度得到由各標題詞組成的商品之間的相似度。該方法可以根據各標題詞的分布式向量表示以及各標題詞之間的相似度對新加入的商品以及銷量較小的商品進行打分,從而可以使得推薦系統可以根據各新加入的商品以及銷量較小的商品的分數進行推薦,可以進一步的幫助用戶推薦需要的產品以提高產品的銷售數量以及用戶的滿意度。
技術領域
本公開涉及數據處理技術領域,具體而言,涉及一種商品相似度計算方法、商品相似度計算裝置、計算機可讀存儲介質以及電子設備。
背景技術
隨著電子商務技術與物流配送體系的不斷發展以及完善,網上購物也受到越來越多消費者的歡迎,與此同時,網上購物的種類也在不斷拓展。在這種形勢下,各個電商網站的競爭也在日益加劇;而各電商網站隨之產生的推薦系統不僅有利于消費者用更少的點擊和時間找到自己需要的商品,也更加有利于提高電子商務網站的銷售額度以及用戶滿意度。
在上述電子商務網站的推薦系統中,應用較為廣泛的一類算法可以包括基于商品的協同過濾算法。其中,基于商品的協同過濾算法包括一個基本的假設,例如可以是:“能夠引起用戶興趣的項目,必定與其之前評分高的項目相似”;例如,用戶搜索、點擊或者收藏過某一款“洗發水”商品,推薦系統可以認為該用戶對該款洗發水感興趣,因此會給出比較高的評分;然后利用已經計算好的商品間相似度作為權重把該比較高的評分傳遞給其它商品,最后把經過傳遞后評分比較高的商品推薦給用戶。
進一步的,在基于商品的協同過濾算法中,核心的部分可以包括商品間相似度的計算。常用的相似度計算方法可以利用用戶對各個商品的評分距離(如余弦距離)來代替;但是,計算余弦距離需要大量的用戶評分信息,對于銷量較小的商品只有非常有限的用戶評分信息,新加入的商品通常沒有用戶的評分信息,因此對于銷量較小的商品以及新加入的商品(可以被稱為冷啟動商品)來說,很難通過上述方法被推薦給需要的用戶。
在目前的電子商務推薦系統中,對于銷量較小的商品以及新加入的商品相似度的計算方法可以包括:人工標注、基于圖片的相似度計算以及基于標題的文本相似性算法。但是,利用人工標注、基于圖片的相似度計算以及基于標題的文本相似性算法存在如下缺點:(1)對于新加入的商品,人工標注只能對有限個商品進行相似度標注,無法對全部商品進行相似度標注;(2)基于圖片的相似度計算可以很好的處理部分品類的冷啟動商品(如服裝),但是無法處理某些外觀相似但內部參數和價格差距較大的商品(如電腦配件);(3)部分文本相似性算法(如simhash)無法對同義詞和近義詞進行處理,如,有的商家在標題中用“夏裝”,有的商家用“夏季”來描述同一件服裝類商品;而現有的可以對同義詞與近義詞進行處理的文本相似性算法(如word2vec)只適用于有一定結構和順序的自然語言,對電子商務網站中的標題不適用。
因此,需要提供一種新的商品相似度計算方法。
需要說明的是,在上述背景技術部分公開的信息僅用于加強對本公開的背景的理解,因此可以包括不構成對本領域普通技術人員已知的現有技術的信息。
發明內容
本公開的目的在于提供一種商品相似度計算方法、商品相似度計算裝置、計算機可讀存儲介質以及電子設備,進而至少在一定程度上克服由于相關技術的限制和缺陷而導致的一個或者多個問題。
根據本公開的一個方面,提供一種商品相似度計算方法,包括:
利用第一機器學習模型對多個標題詞進行學習得到多個與各所述標題詞關聯的分布式向量表示;
利用第二機器學習模型對各所述分布式向量表示以及歷史商品相似度進行學習得到各標題詞之間的相似度;
根據各所述標題詞之間的相似度得到由各所述標題詞組成的商品之間的相似度。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京京東尚科信息技術有限公司;北京京東世紀貿易有限公司,未經北京京東尚科信息技術有限公司;北京京東世紀貿易有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710953390.8/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:分綜絲機
- 下一篇:用于涂布裝置的可調滾壓結構





