[發(fā)明專利]一種基于異構(gòu)圖表達(dá)學(xué)習(xí)的跨境電商推薦方法有效
| 申請?zhí)枺?/td> | 202110728252.6 | 申請日: | 2021-06-29 |
| 公開(公告)號: | CN113409121B | 公開(公告)日: | 2022-02-15 |
| 發(fā)明(設(shè)計)人: | 朱桂祥;曹杰;張瑾;夏天豪;王宇琛;溫宇 | 申請(專利權(quán))人: | 南京財經(jīng)大學(xué) |
| 主分類號: | G06F17/18 | 分類號: | G06F17/18 |
| 代理公司: | 南京蘇創(chuàng)專利代理事務(wù)所(普通合伙) 32273 | 代理人: | 常曉慧 |
| 地址: | 210023 *** | 國省代碼: | 江蘇;32 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 構(gòu)圖 表達(dá) 學(xué)習(xí) 跨境電商 推薦 方法 | ||
1.一種基于異構(gòu)圖表達(dá)學(xué)習(xí)的跨境電商推薦方法,其特征在于,包括如下步驟:
步驟1):對跨境電商用戶的原始數(shù)據(jù)進(jìn)行提取,分別獲得訂單數(shù)據(jù)和產(chǎn)品描述數(shù)據(jù);其中,訂單數(shù)據(jù)表示為一個3元組:描述為User_ID,Item_ID,Quantity,其中User_ID為用戶標(biāo)識,Item_ID為用戶購買的產(chǎn)品的唯一標(biāo)識,Quantity為用戶累計購買產(chǎn)品的數(shù)量;產(chǎn)品描述數(shù)據(jù)描述為Item_ID,Title,Price,其中Title為商品的標(biāo)題;Price為產(chǎn)品價格;對訂單數(shù)據(jù)進(jìn)行去除噪音數(shù)據(jù)和缺失數(shù)據(jù)的操作,獲得最終“用戶-產(chǎn)品”購買矩陣M,對產(chǎn)品描述數(shù)據(jù)進(jìn)行去除噪音數(shù)據(jù)和缺失數(shù)據(jù)的操作獲得產(chǎn)品文本描述數(shù)據(jù)D;
其中,首先從用戶購買產(chǎn)品種類數(shù)量分布、用戶下單頻率分布、產(chǎn)品銷量分布這3個角度對跨境電商“用戶-產(chǎn)品”購買矩陣M進(jìn)行量化分析;
轉(zhuǎn)入步驟2);
步驟2):基于產(chǎn)品文本描述數(shù)據(jù)D,挖掘產(chǎn)品的隱語義主題,利用主題信息識別用戶的興趣偏好;對于任意一個產(chǎn)品經(jīng)過隱語義主題模型泛化后獲取所有電商產(chǎn)品的主題,最終獲得“主題-產(chǎn)品”矩陣T,具體如下:
產(chǎn)品文本描述數(shù)據(jù)D,對于D中任意一個產(chǎn)品i經(jīng)過隱語義主題模型泛化后獲得其主題概率分布,記為其中K為產(chǎn)品泛化后的主題數(shù)量,k為主題的序號;選擇θi集合中最大的概率分布值對應(yīng)的主題作為最終產(chǎn)品的主題,抽象為函數(shù)
其中,tk表示為產(chǎn)品i經(jīng)泛化后的主題,最終,獲得“主題-產(chǎn)品”矩陣T;
轉(zhuǎn)入步驟3);
步驟3):基于“用戶-產(chǎn)品”購買矩陣M和“主題-產(chǎn)品”矩陣T,構(gòu)造跨境電商“用戶-產(chǎn)品-主題”三部圖:
若“用戶-產(chǎn)品”購買矩陣M和“主題-產(chǎn)品”矩陣T中的元素不為空,則其分別對應(yīng)的用戶u和產(chǎn)品i,以及主題t和產(chǎn)品i之間的節(jié)點(diǎn)則會產(chǎn)生一條邊;遍歷完跨境電商“用戶-產(chǎn)品”購買矩陣M和“主題-產(chǎn)品”矩陣T中的元素,從而構(gòu)造出“用戶-產(chǎn)品-主題”三部圖,記為G=(V,R),其中V為“用戶-產(chǎn)品-主題”三部圖中節(jié)點(diǎn)集合,R為“用戶-產(chǎn)品-主題”三部圖中的邊集合,轉(zhuǎn)入步驟4);
步驟4):將構(gòu)造的跨境電商“用戶-產(chǎn)品-主題”三部圖G以4:1的比例劃分為訓(xùn)練集Training Set和測試集Test Set,并建立異構(gòu)圖神經(jīng)網(wǎng)絡(luò)推薦模型,即HNGR;在訓(xùn)練階段,將訓(xùn)練集Training Set輸入HNGR,并采用傳統(tǒng)的圖神經(jīng)網(wǎng)絡(luò)中的信息傳播架構(gòu),沿著跨境電商“用戶-產(chǎn)品-主題”三部圖結(jié)構(gòu)來獲取協(xié)同過濾信號,從而分別求得用戶的表征向量ru和產(chǎn)品的表征向量ri,通過激勵函數(shù)產(chǎn)生推薦結(jié)果;在優(yōu)化階段,通過Adam優(yōu)化器獲得HNGR的最優(yōu)參數(shù)配置,并保存訓(xùn)練好的HNGR:
HNGR采用圖神經(jīng)網(wǎng)絡(luò)中的信息傳播架構(gòu)沿著跨境電商“用戶-產(chǎn)品-主題”三部圖結(jié)構(gòu)來獲取協(xié)同過濾信號,從而分別求得用戶的表征向量ru和產(chǎn)品的表征向量ri,用戶u的表征向量ru具體如下:
1)信息傳播:在通用的單層GNN網(wǎng)絡(luò)中,對于由“用戶-產(chǎn)品”購買矩陣M構(gòu)造的傳統(tǒng)的二部圖而言,存在邊連接的任意一組“用戶-產(chǎn)品”記為(u,i),其含義為用戶u對產(chǎn)品i產(chǎn)生過購買記錄,產(chǎn)品i至用戶u的信息記為mu←i:
mu←i=f(xi,xu,cu,i)
此處,f(·)是信息的編碼函數(shù),xi和xu分別代表產(chǎn)品i和用戶u的表征向量,其中xi由One-Hot編碼求得,xu均由訓(xùn)練好的BERT模型求得;cu,i是用于控制任意一條邊(u,i)傳播的衰減因子,采用正則化變量表示;f(·)通過以下方式實(shí)現(xiàn):
其中,Nu代表與用戶u存在邊連接的產(chǎn)品數(shù)量,權(quán)重W1、W2和W3是GNN網(wǎng)絡(luò)中可訓(xùn)練的權(quán)重矩陣,在信息傳播中用于提取有用信息;表示向量拼接,上述公式簡化為:
;
對于“用戶-產(chǎn)品-主題”三部圖中存在邊連接的任意一組(u,i),產(chǎn)品i至用戶u的信息記為mu←i:
其中,z代表與產(chǎn)品i同屬一個主題的所有產(chǎn)品,代表產(chǎn)品i所屬主題包含的產(chǎn)品數(shù)量,W’1、W’2和W’3是GNN網(wǎng)絡(luò)中可訓(xùn)練的權(quán)重矩陣;
2)信息聚合:在信息傳播的基礎(chǔ)之上,進(jìn)一步對從用戶u的所有鄰居節(jié)點(diǎn)傳播的信息進(jìn)行聚合,從而獲得用戶u的表達(dá)向量;用戶u的所有鄰居節(jié)點(diǎn)包括傳統(tǒng)二部圖中的鄰居節(jié)點(diǎn)以及通過“用戶-產(chǎn)品-主題”三部圖G獲取的鄰居節(jié)點(diǎn),信息聚合的函數(shù)hu定義為:
其中,σ(·)是激勵函數(shù),選擇ReLU(·)=max(0,·)作為激勵函數(shù);
為了獲得用戶u最終的表達(dá)向量,將向量hu經(jīng)過如下方式轉(zhuǎn)換:
ru=σ(Wuhu+bu),
其中,Wu和bu分別代表可訓(xùn)練的權(quán)重矩陣和偏置向量,ru代表經(jīng)過GNN中嵌入傳播層學(xué)習(xí)所獲得的用戶u表達(dá)向量;此處,同樣采用ReLU作為激勵函數(shù);
轉(zhuǎn)入步驟5);
步驟5):通過將測試集Test Set輸入到訓(xùn)練好的HNGR,分別對測試集中待推薦的用戶計算產(chǎn)生個性化的電商產(chǎn)品推薦列表,從而實(shí)現(xiàn)跨境電商產(chǎn)品推薦。
2.根據(jù)權(quán)利要求1所述的基于異構(gòu)圖表達(dá)學(xué)習(xí)的跨境電商推薦方法,其特征在于:步驟4)中,采用用戶u的表達(dá)向量ru和產(chǎn)品i的表達(dá)向量ri來預(yù)測用戶u對產(chǎn)品i的交互分值,定義為:
其中,Wj和bj分別代表MLP中可訓(xùn)練的權(quán)重矩陣和偏置向量,l代表MLP網(wǎng)絡(luò)的總層數(shù);σ(·)是激勵函數(shù),選擇ReLU作為激勵函數(shù);MLP的最終輸出為得到的u對產(chǎn)品i的交互分值,即給定用戶u對產(chǎn)品i的交互分值采用函數(shù)去獲取模型的輸出,即用戶u購買產(chǎn)品i的概率
在訓(xùn)練階段,積極標(biāo)簽是用戶真實(shí)購買的產(chǎn)品集,即存在交互,記為Y+;而消極標(biāo)簽是從產(chǎn)品集合I中去除積極標(biāo)簽進(jìn)行l(wèi)og-uniform采樣形成,即不存在交互,記為Y-;采用基于二元交叉熵作為HNGR的損失函數(shù),即:購買概率和真實(shí)情況的損失函數(shù)定義如下:
其中,yu,i是產(chǎn)品i被用戶u真實(shí)購買的概率分布;具體而言,如果(u,i)∈Y+,則yu,i=1,反之yu,i=0。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于南京財經(jīng)大學(xué),未經(jīng)南京財經(jīng)大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110728252.6/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 自動構(gòu)圖支持裝置及方法
- 數(shù)字圖像處理裝置中提供構(gòu)圖信息的方法和設(shè)備
- 系統(tǒng)設(shè)計裝置
- 輔助影像拍攝的構(gòu)圖裝置及數(shù)碼相機(jī)
- 一種移動終端圖片查看方法及系統(tǒng)
- 卷紙構(gòu)圖
- 照片拍攝的構(gòu)圖方法、構(gòu)圖裝置及計算機(jī)可讀存儲介質(zhì)
- 輔助拍攝方法、終端設(shè)備及計算機(jī)可讀存儲介質(zhì)
- 一種異構(gòu)圖卷積網(wǎng)絡(luò)的訓(xùn)練方法、裝置、設(shè)備和介質(zhì)
- 構(gòu)圖方法,構(gòu)圖裝置,構(gòu)圖模板及構(gòu)圖模板制造方法
- RNAi轉(zhuǎn)染子的改良選擇方法
- 雙控雙調(diào)節(jié)原核表達(dá)載體系統(tǒng)及其構(gòu)建方法和用途
- 表達(dá)載體組織、新的生產(chǎn)用細(xì)胞產(chǎn)生方法及其在重組產(chǎn)生多肽中的用途
- 大腸桿菌表達(dá)系統(tǒng)表達(dá)人淀粉樣Aeta蛋白及純化的方法
- 一種智能表達(dá)式解析平臺及方法
- 一種復(fù)合表達(dá)式解析方法及系統(tǒng)
- 一種制備N-乙酰氨基半乳糖轉(zhuǎn)移酶的方法
- 定制生成表達(dá)式方法及裝置
- 文本的表達(dá)方法、裝置、電子設(shè)備及可讀存儲介質(zhì)
- 基因表達(dá)調(diào)節(jié)DNA,表達(dá)盒,表達(dá)載體
- 根據(jù)用戶學(xué)習(xí)效果動態(tài)變化下載學(xué)習(xí)數(shù)據(jù)的系統(tǒng)及方法
- 用于智能個人化學(xué)習(xí)服務(wù)的方法
- 漸進(jìn)式學(xué)習(xí)管理方法及漸進(jìn)式學(xué)習(xí)系統(tǒng)
- 輔助學(xué)習(xí)的方法及裝置
- 基于人工智能的課程推薦方法、裝置、設(shè)備及存儲介質(zhì)
- 基于強(qiáng)化學(xué)習(xí)的自適應(yīng)移動學(xué)習(xí)路徑生成方法
- 一種線上視頻學(xué)習(xí)系統(tǒng)
- 一種基于校園大數(shù)據(jù)的自適應(yīng)學(xué)習(xí)方法、裝置及設(shè)備
- 一種學(xué)習(xí)方案推薦方法、裝置、設(shè)備和存儲介質(zhì)
- 游戲?qū)W習(xí)效果評測方法及系統(tǒng)





