[發明專利]基于特征交互圖神經網絡的上下文感知推薦方法及系統有效
| 申請號: | 202010793376.8 | 申請日: | 2020-08-10 |
| 公開(公告)號: | CN111931052B | 公開(公告)日: | 2023-09-15 |
| 發明(設計)人: | 高茜;馬鵬程 | 申請(專利權)人: | 齊魯工業大學 |
| 主分類號: | G06F16/9535 | 分類號: | G06F16/9535;G06F16/2458;G06N3/045;G06N3/048;G06N3/042;G06N3/0442;G06N3/08 |
| 代理公司: | 濟南信達專利事務所有限公司 37100 | 代理人: | 孫園園 |
| 地址: | 250353 山東*** | 國省代碼: | 山東;37 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 特征 交互 神經網絡 上下文 感知 推薦 方法 系統 | ||
1.一種基于特征交互圖神經網絡的上下文感知推薦方法,其特征在于,該方法是通過構建上下文感知圖神經網絡模型建立上下文環境與用戶以及上下文環境與項目的交互關系,提高推薦系統預測的準確性和可解釋性;具體如下:
S1、從數據集中獲取用戶、項目及上下文的特征數據;具體如下:
根據用戶已完成活動的歷史記錄建立數據集,從數據集中選取用戶、項目和不同的上下文環境信息,進而獲取特征數據;其中,數據集表示如下:
X∈{u,v,c1,c2,...,ck};
其中,u表示用戶特征字段;v表示項目特征字段;c表示上下文環境字段;ck表示第k個上下文環境特征;k∈{0,1,2,...,K},表示最多有K個上下文環境特征;xi表示X中任一個特征字段,i∈{0,1,2,...,m},m=K+2;
S2、根據歷史記錄將數據集劃分為上下文-用戶數據集和上下文-項目數據集;其中,上下文-用戶數據集和上下文-項目數據集分別表示為Xu∈{u,c1,c2,...,ck}和Xv∈{v,c1,c2,...,ck};
S3、分別對上下文-用戶數據集和上下文-項目數據集進行one-hot編碼和embedding嵌入;具體如下:
S301、將每個字段表示為一個one-hot編碼向量;
S302、將one-hot編碼向量輸入到embedding層得到上下文-用戶特征嵌入向量Eu,c和上下文-項目特征嵌入向量Ev,c,公式如下:
Eu,c=[eu,ec1,ec2,...,eck];
Ev,c=[ev,ec1,ec2,...,eck];
其中,eu、ev和eck分別表示字段u、v、ck的嵌入向量,eu∈RD,ev∈RD,eck∈RD;D表示字段嵌入向量的維數;
S4、構造上下文-用戶和上下文-項目特征圖;具體如下:
S401、將各節點之間的關系表示為圖結構:根據數據集構造一個上下文-用戶及上下文-項目交互圖G=(N,ε);交互圖中每個節點,使得|N|=|X|,X表示輸入數據量;ε表示兩個節點ni-1和ni的邊;
S402、交互圖是一個加權完全連通圖,即每兩個節點是雙向互動,邊的權值反映不同特征域之間的交互影響,根據訓練集計算不同特征字段之間有向邊的權值,公式如下:
其中,w(ni,nj)表示從節點ni到節點nj的權重值;表示節點特征xi和節點特征xj的共現頻率;表示節點特征xi的出現頻率;
S5、分別對上下文-用戶特征圖和上下文-項目特征圖中的節點進行初始化表示;具體如下:
S501、初始節點狀態為輸入特征圖的節點狀態,即字段嵌入向量;
S502、利用字段的嵌入向量作為對應節點的初始狀態向量,形式化和公式所如下:
其中,H表示圖的隱藏狀態向量,圖是由多個節點構成,H∈R(m-1)×D;表示上下文-用戶交互圖中各節點的初始狀態向量;表示上下文-項目交互圖各節點的初始狀態向量;e表示節點嵌入向量;h表示節點隱藏狀態向量,h∈RD;
S6、分別對上下文-用戶特征圖和上下文-項目特征圖中的節點進行特征交互建模;其中,特征交互建模是指節點與鄰居交互并以循環的方式更新各自的狀態,在每個交互步驟中,每個節點將先聚合來自鄰居的已轉換狀態信息,再通過GRU和剩余連接根據聚合的信息和歷史更新各自的狀態;具體如下:
S601、每個節點都與一個隱藏的狀態向量相關聯,公式如下:
其中,表示上下文-用戶交互圖中各節點狀態集合;表示上下文-項目交互圖各節點狀態集合:t表示相互作用的步驟;
S602、邊ni→nj從節點ni到節點nj的變換函數公式如下:
其中,Wout表示輸出矩陣;Win表示輸入矩陣;表示CA-GNN中的每個節點ni與不同節點間的雙向交互影響;
S603、節點接收到的鄰居狀態公式如下:
其中,bp表示所有邊上共享線性變換的權值和偏差;A[vj,ni]表示鄰接矩陣;
S604、接收到狀態信息后,節點ni的狀態將更新如下,更新過程如以下公式所示:
其中,Wz、Wr、Wh、bz、br、bh為更新函數的權值和偏差,與門控遞歸單元(GRU)相似;和分別是更新門矢量和重置門矢量;
S605、通過剩余連接進行狀態更新:門控遞歸單元輸出的節點隱藏狀態hit,公式如下:
S7、構建圖神經網絡輸出層,得到預測結果;具體如下:
S701、經過T步驟的傳播得到經上下文-用戶交互和上下文-項目交互所產生的節點隱狀態,公式如下:
其中,T與t的含義相同,均表示相互作用的步驟;
S702、將新的上下文-用戶交互和上下文-項目交互所產生的節點隱狀態進行合并得到混合節點隱狀態值,公式如下:
其中,w表示混合節點矩陣權重值;H∈R2(m-1)×D;m表示特征域數量,D表示字段嵌入向量的維數;
S703、節點與節點的T序列鄰居交互,對T序列特性交互進行建模并構建一個圖形級的輸出層來預測評分值;
S704、每個字段節點都與自身外的其他特征進行交互,并最終捕獲了全局狀態信息,再分別通過每個字段的最終狀態進行評分,并使用一個注意力機制來衡量每個字段對整體預測的影響;具體如下:
S70401、每個節點ni及其注意節點權重的預測得分通過多層感知器層和注意力機制層分別得到,公式如下:
其中,MLP1用于對全局感知的每個字段的預測分數進行建模;MLP2用于對每個字段的權重進行建模;
S70402、輸出的評分預測函數,公式如下:
其中,wo和bo分別表示輸出函數的權重值和偏差值,是實際訓練數據集中的評分次數;σ(·)表示sigmoid函數;
S70403、損失函數公式如下:
當損失函數取得最小值時,得到最優的訓練參數。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于齊魯工業大學,未經齊魯工業大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010793376.8/1.html,轉載請聲明來源鉆瓜專利網。





