[發明專利]一種融合異質信息網絡的可解釋推薦方法有效
| 申請號: | 202011276253.3 | 申請日: | 2020-11-16 |
| 公開(公告)號: | CN112380434B | 公開(公告)日: | 2022-09-16 |
| 發明(設計)人: | 王英;賈天浩;王鑫;左萬利;楊偉英;左祥麟 | 申請(專利權)人: | 吉林大學 |
| 主分類號: | G06F16/9535 | 分類號: | G06F16/9535;G06Q30/06 |
| 代理公司: | 長春市恒譽專利代理事務所(普通合伙) 22212 | 代理人: | 李榮武 |
| 地址: | 130012 吉*** | 國省代碼: | 吉林;22 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 融合 信息網絡 可解釋 推薦 方法 | ||
1.一種融合異質信息網絡的可解釋推薦方法,其方法如下所述:
(1)通過互聯網獲得含有豐富異質信息的真實數據集,分別處理數據集,抽取得到商品和用戶的特征信息,和特征之間的關系信息:
1)通過互聯網上推薦系統相關的網站獲取公開的包含異質信息的推薦系統數據集;
2)對于異質信息推薦系統數據集中包含的實體特征:商品的評論、商品的描述,商品種類,商品價格,商品品牌和購買關系,根據不同的關系抽取成多個兩兩實體之間的相似度矩陣,矩陣前兩列為兩個實體的名字,第三列為實體之間關系的評分;
3)通過數據處理得到數據集中包含的實體數量和關系數量;數據集的稀疏程度通過密度得到表示,數據密度按如下公式計算的:
其中分子是評分數量,分母是用戶數量與商品數量的乘積;
(2)對于的得到的特征信息和關系信息,利用元路徑的方法組合,得到不同關系下的用戶和商品的相似度矩陣,通過推薦系統中矩陣分解的方法對上述得到的多個相似度矩陣進行分解,得到在不同元路徑下的用戶和商品特征表示向量:
1)首先需要通過設計L條元路徑;
2)對于設定的元路徑,采用矩陣乘法可以得到對應的用戶商品相似度矩陣,基于元路徑的相似度矩陣是兩個關系矩陣之間的矩陣乘法操作,MAn-1An表示實體類型An-1與實體類型An之間關系的相似度矩陣;
3)、得到L條元路徑對應的用戶商品相似度矩陣之后,使用矩陣分解來獲得用戶和商品的潛在表示,矩陣分解的優化目標函數:其中是通過用戶和商品的表示向量矩陣相乘得到的預測矩陣,U代表用戶喜好的潛在特征,B是商品含有的潛在特征,代表預測相似度矩陣;和是動態參數,用于控制傅里葉范數正則化影響以避免過擬合;
4)對于之前設計的L條元路徑,通過實體關系矩陣乘法得到L個基于元路徑的相似度矩陣,同時進行如上的矩陣分解操作,得到L組不同的用戶和商品的特征表示U(1),B(1),U(2),B(2)…,U(L),B(L);
(3)對于不同元路徑下的用戶和商品特征表示向量,設計不同的注意力神經網絡組合多個特征表示向量:
1)設計一個局部的注意力網絡,局部注意力網絡的目標是獲得組合了L組不同路徑信息的用戶和商品表示UL和BL,對于L組用戶表示ui,i∈L,將它們依次輸入面向用戶表示的注意力神經網絡中,得到對應ui的注意力系數αi:
DNNu(ui)=Relu(WU*(Relu(…(ui)…))+BU)
其中DNNu(ui)是面向用戶的注意力神經網絡,它的輸入是不同路徑的用戶表示向量,WU是神經網絡全連接系數矩陣,BU是每一層的偏置,每層的激活函數都是Relu;然后通過softmax函數將神經網絡的L個輸出值歸一化得到注意力系數αi,對于商品采用同樣的操作可以得到對應不同路徑下商品表示的注意力系數βi:
DNNb(bi)=Relu(WB*(Relu(…(bi)…))+BB)
之后,根據得到的注意力系數αi和βi分別組合L組路徑的用戶和商品表示得到組合L組不同路徑信息的用戶和商品表示UL和BL,將用戶/商品表示乘以對應的注意力系數αi/βi,然后Concatenate操作直接拼接L組αi*ui/βi*bi:
UL=Concate(α1*u1||α2*u2…||αi*ui)
BL=Concate(β1*b1||β2*b2…||βi*bi)
最后,通過將用戶和商品表示UL和BL拼接就可以得到用戶和商品交互特征表示向量,即交互預測方法多層感知機的輸入向量Plocal,如下所示:
Plocal=Concate(UL||BL)
=Concate(α1*u1||α2*u2…||αi*ui||β1*b1||β2*b2…||βi*bi);
2)設計一個全局注意力網絡,首先將每一組路徑對應的表示向量ui和bi拼接,得到對應路徑的交互特征表示pi,pi=Concate(ui||bi),i∈L,然后將L組pi依次輸入面向交互特征的注意力神經網絡DNNZ中,得到對應的注意力系數θi:
DNNZ(pi)=Relu(WZ*(Relu(…(pi)…))+BZ)
其中DNNZ是多層的神經網絡,輸入是L組的交互特征表示pi,WZ、BZ、Relu分別是神經網絡對應的全連接系數矩陣、層偏置項和激活函數,然后通過softmax函數將神經網絡的L個輸出值歸一化得到注意力系數θi;
根據得到的注意力系數θi組合L組路徑的交互特征表示pi得到組合不同路徑信息的用戶和商品交互特征表示Pglobal,將L組路徑的交互特征表示pi乘以對應的注意力系數θi,然后通過Concatenate操作直接拼接L組θi*pi:
Pglobal=Concate(θ1*p1||θ2*p2…||θi*pi);
3)、設計實體向量表示的交互方法,將基于局部注意力網絡的交互特征表示Plocal和基于全局注意力網絡的交互特征表示Pglobal組合在一起采用組合方式有如下兩種:
P=λ1*Plocal+λ2*Pglobal
P=Concate(λ1*Plocal||λ2*Pglobal)
其中λ1∈(0,1)和λ2∈(0,1)是參數,用于決定每一部分信息的保留,第一中方法是將局部的交互特征表示Plocal和全局的交互特征表示Pglobal相加,第二種方法是將二者拼接組合;
采用神經網絡作為特征交互方法能夠自動組合高階特征關系,輸入為最終的特征交互向量P,輸出預測的評分,如下所示:
ypred=Relu(W*(Relu(…(P)…))+B);
4)通過目標任務即顯示數據的評分預測任務,設計平方損失函數作為優化目標:
Loss=(ypred-yreal)2+λ*||Para||2
其中,ypred是方法預測的評分,yreal是用戶對商品真實的評分,Para是神經網絡中可訓練的參數,上式第一部分是真實值與預測值的平方差,第二部分是L2正則化,λ系數用于控制正則化強度以防止過擬合;
(4)、通過實驗結果比較獲取注意力神經網絡方法,將通過該方法組合得到的特征表示向量輸入多層感知機方法中獲得用戶對商品的評分預測:
1)設計5種變體方法,分別是不使用注意力機制的方法,只使用局部注意力網絡的方法,只使用全局注意力網絡的方法,在將局部的交互特征表示和全局的交互特征表示組合時采取相加操作的方法及采取將二者拼接組合的方法;
2)對以上5種變體方法進行了對比試驗;通過方法變體對比試驗的結果,選擇出最優的方法作為最終的預測方法;
(5)基于用戶對商品的評分預測,給用戶推薦評分預測最高的商品,并基于注意力網絡中的注意力系數給出推薦理由:
1)確定最優的注意力神經網絡方法,使用該方法進行預測,得到用戶對商品的預測評分,將預測評分高的物品推薦給該用戶;
2)獲得全局注意力網絡的注意力系數并可視化;
3)依據得到的注意力系數,基于系數最大的元路徑生成解釋作為給用戶推薦該商品的理由。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于吉林大學,未經吉林大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011276253.3/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種基于數字孿生平臺的模塊化建筑物健康監測系統
- 下一篇:一種電飯煲金屬外殼





