[發(fā)明專利]用于基于FastText模型向用戶推薦商品的方法、裝置、電子設(shè)備及存儲(chǔ)介質(zhì)在審
| 申請(qǐng)?zhí)枺?/td> | 201710045166.9 | 申請(qǐng)日: | 2017-01-19 |
| 公開(kāi)(公告)號(hào): | CN108335127A | 公開(kāi)(公告)日: | 2018-07-27 |
| 發(fā)明(設(shè)計(jì))人: | 歐輝思;郭文濤 | 申請(qǐng)(專利權(quán))人: | 北京京東尚科信息技術(shù)有限公司;北京京東世紀(jì)貿(mào)易有限公司 |
| 主分類號(hào): | G06Q30/02 | 分類號(hào): | G06Q30/02;G06Q30/06;G06F17/30 |
| 代理公司: | 中科專利商標(biāo)代理有限責(zé)任公司 11021 | 代理人: | 楊?yuàn)?/td> |
| 地址: | 100195 北京市海淀區(qū)杏石口路6*** | 國(guó)省代碼: | 北京;11 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 商品向量 特征向量 用戶推薦 瀏覽 相似度算法 存儲(chǔ)介質(zhì) 電子設(shè)備 特征信息 向量確定 序列生成 向量 | ||
本公開(kāi)公開(kāi)了一種用于基于FastText模型向用戶推薦商品的方法,包括:將所述用戶正在瀏覽的第一商品的商品向量和特征向量組合為最終向量;以及利用相似度算法根據(jù)所述最終向量確定與所述第一商品相似的多個(gè)推薦商品,其中,所述商品向量是利用FastText模型中的Word2Vec模塊,根據(jù)與所述第一商品相關(guān)的一個(gè)或多個(gè)商品瀏覽序列生成的;以及所述特征向量是利用FastText模型中的Ngrams模塊,根據(jù)與所述第一商品相關(guān)的特征信息生成的。
技術(shù)領(lǐng)域
本公開(kāi)總體上涉及互聯(lián)網(wǎng)技術(shù)領(lǐng)域,更具體地,涉及用于基于FastText模型向用戶推薦商品的方法、裝置、電子設(shè)備及存儲(chǔ)介質(zhì)。
背景技術(shù)
在推薦系統(tǒng)中,存在很多基于用戶的商品瀏覽序列的推薦場(chǎng)景。可以認(rèn)為,同一個(gè)用戶的商品瀏覽序列內(nèi)的商品是相互關(guān)聯(lián)的。基于用戶的商品瀏覽序列的推薦,即根據(jù)瀏覽序列挖掘商品間的關(guān)聯(lián)性,可以根據(jù)每個(gè)商品挖掘出與之最相關(guān)的商品集合。可以認(rèn)為,用戶在瀏覽某個(gè)商品之后,會(huì)大概率有興趣瀏覽這個(gè)商品的最相關(guān)商品集合內(nèi)的商品,于是可以將這樣的商品集合推薦給當(dāng)前正在瀏覽以及歷史瀏覽過(guò)該商品的用戶。
現(xiàn)有的基于用戶商品瀏覽序列推薦方法主要為字轉(zhuǎn)向量模型(Word2Vec)。Word2Vec將每個(gè)商品(由可用商品ID表示)當(dāng)作一個(gè)Word(字),并且每個(gè)用戶的商品瀏覽序列當(dāng)作一個(gè)Sentence(句子)。對(duì)每個(gè)Word,Word2Vec選中包含該Word上下文(前后Word)的窗口,該Word與窗口中的其他Word有相關(guān)性,可根據(jù)該Word對(duì)其上下文Word進(jìn)行預(yù)測(cè)。通過(guò)不斷輸入用戶的商品瀏覽序列(Sentence),依據(jù)上述方法可對(duì)每個(gè)商品訓(xùn)練出該商品的定長(zhǎng)商品向量。
在得到所有商品各自的商品向量之后,根據(jù)余弦相似度算法、皮爾遜相似度算法等相似度計(jì)算方法計(jì)算出每個(gè)商品的最相似的商品集合。圖1示出了Word2Vec的具體結(jié)構(gòu)圖。商品向量(如表1所示)的維度相同,比如100維。維度可以在初始時(shí)人為指定。向量值為浮點(diǎn)數(shù)。
表1
現(xiàn)有基于用戶商品瀏覽序列的推薦方法Word2Vec的流程如下:從數(shù)據(jù)庫(kù)、日志中篩選出所有用戶的商品瀏覽序列集合;根據(jù)Word2Vec訓(xùn)練出商品的商品向量;計(jì)算商品向量的相似度,獲得每個(gè)商品最相似的商品集合;以及向?yàn)g覽過(guò)或正在瀏覽特定商品的用戶推薦該商品的相似商品集合。
然而,現(xiàn)有基于用戶商品瀏覽序列的推薦方法Word2Vec具有以下缺點(diǎn):首先,Word2Vec只利用用戶的商品瀏覽序列訓(xùn)練商品向量,沒(méi)有利用每個(gè)商品本身的屬性特性(如商品標(biāo)題、商品屬性如類別等)信息,準(zhǔn)確性不足;其次,對(duì)瀏覽次數(shù)很少的商品或新加入商品,因?yàn)g覽序列很少,無(wú)法通過(guò)Word2Vec訓(xùn)練得到準(zhǔn)確的商品向量,即Word2Vec對(duì)長(zhǎng)尾物品和冷啟動(dòng)物品的推薦效果差,推薦多樣性和準(zhǔn)確性不足。
發(fā)明內(nèi)容
鑒于此,本公開(kāi)提出了用于基于FastText模型向用戶推薦商品的方法、系統(tǒng)和計(jì)算機(jī)可讀介質(zhì)。
在本公開(kāi)的第一方面,提供了一種基于FastText模型向用戶推薦商品的方法,包括:
將所述用戶正在瀏覽的第一商品的商品向量和特征向量組合為最終向量;以及
利用相似度算法根據(jù)所述最終向量確定與所述第一商品相似的多個(gè)推薦商品,
其中,所述商品向量是利用FastText模型中的Word2Vec模塊,根據(jù)與所述第一商品相關(guān)的一個(gè)或多個(gè)商品瀏覽序列生成的;以及
所述特征向量是利用FastText模型中的Ngrams模塊,根據(jù)與所述第一商品相關(guān)的特征信息生成的。
優(yōu)選地,所述特征信息包括標(biāo)題信息和屬性信息。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于北京京東尚科信息技術(shù)有限公司;北京京東世紀(jì)貿(mào)易有限公司,未經(jīng)北京京東尚科信息技術(shù)有限公司;北京京東世紀(jì)貿(mào)易有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買(mǎi)此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710045166.9/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06Q 專門(mén)適用于行政、商業(yè)、金融、管理、監(jiān)督或預(yù)測(cè)目的的數(shù)據(jù)處理系統(tǒng)或方法;其他類目不包含的專門(mén)適用于行政、商業(yè)、金融、管理、監(jiān)督或預(yù)測(cè)目的的處理系統(tǒng)或方法
G06Q30-00 商業(yè),例如購(gòu)物或電子商務(wù)
G06Q30-02 .行銷,例如,市場(chǎng)研究與分析、調(diào)查、促銷、廣告、買(mǎi)方剖析研究、客戶管理或獎(jiǎng)勵(lì);價(jià)格評(píng)估或確定
G06Q30-04 .簽單或開(kāi)發(fā)票
G06Q30-06 .購(gòu)買(mǎi)、出售或租賃交易
G06Q30-08 ..拍賣(mài)





