[發明專利]一種基于圖算法的會話推薦系統在審
| 申請號: | 202310440162.6 | 申請日: | 2023-04-23 |
| 公開(公告)號: | CN116485496A | 公開(公告)日: | 2023-07-25 |
| 發明(設計)人: | 王恒基;王衛紅 | 申請(專利權)人: | 浙江工業大學 |
| 主分類號: | G06Q30/0601 | 分類號: | G06Q30/0601;G06F17/16;G06F16/901;G06F16/9535 |
| 代理公司: | 杭州求是專利事務所有限公司 33200 | 代理人: | 陳升華 |
| 地址: | 310012 浙*** | 國省代碼: | 浙江;33 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 算法 會話 推薦 系統 | ||
1.一種基于圖算法的會話推薦系統,其特征在于,包括轉化模塊、對接模塊、實時寫入模塊、獲取模塊、改良鄰接矩陣模塊和改良注意力機制模塊,所述轉化模塊與對接模塊連接,所述對接模塊與實時寫入模塊連接,所述實時寫入模塊與獲取模塊連接,所述獲取模塊與改良鄰接矩陣模塊連接,所述改良鄰接矩陣模塊與改良注意力機制模塊連接。
2.根據權利要求1所述的基于圖算法的會話推薦系統,其特征在于,所述轉化模塊用于在用戶產生點擊、點贊交互行為時將每個行為轉化為一條信息進入kafka,其中所述kafka是一個消息隊列管理工具,負責指令的消費管理;
所述對接模塊用于kakfa與flink對接,其中,所述對接模塊中的flink中存在數據消費需求時由kakfa將數據交給flink進行流式處理數據。
3.根據權利要求1所述的基于圖算法的會話推薦系統,其特征在于,所述實時寫入模塊用于flink將數據實時寫入redis進行存儲;
所述獲取模塊用于獲取redis和HDFS,其中,所述redis是個內存字典型數據庫,所述redis用于推薦系統實時特征存儲的工具,所述redis中的數據通過spark分布式計算存儲入HDFS分布式數據庫中,同時所述redis用于存儲某個用戶的即時喜好,所述HDFS用于存儲備份用戶歷史喜好。
4.根據權利要求3所述的基于圖算法的會話推薦系統,其特征在于,所述實時寫入模塊通過redis提供實時特征,并由HDFS通過spark計算后提供離線特征,通過模型不斷迭代更新響應用戶請求。
5.根據權利要求1所述的基于圖算法的會話推薦系統,其特征在于,所述改良鄰接矩陣模塊用于改良鄰接矩陣,進行改良鄰接矩陣時,需將以前單一的0/1鄰接矩陣,通過利用最短路徑算法找到兩個節點之間的最短路徑之后,變為以最短距離為權重的帶權鄰接矩陣,通過最短路徑捕捉潛在的關系模式。
6.根據權利要求1所述的基于圖算法的會話推薦系統,其特征在于,所述改良注意力機制模塊用于在信息聚合時加入attention改良圖算法的信息聚合能力,所述改良注意力機制模塊中會話表示用戶在時間內連續訪問商品,并按照時間順序將商品進行排列獲得會話,Embedding信息嵌入,翻譯為向量映射是將原始數據組織為向量的形式,且所述結構用于輸入機器學習作為輸入數據。
7.根據權利要求6所述的基于圖算法的會話推薦系統,其特征在于,所述改良注意力機制模塊進行使用時先對獲取到的用戶點擊數據進行表示,其中進行表示時令V={v1,v2,...,vm}表示所有商品,所述v1由第1個商品的ID號碼表示,所述v2由第2個商品的ID號碼表示,所述vm由第m個商品的ID號碼表示,整個系統中共有m個商品,并用表示每個匿名會話,匿名會話由按時間順序排列的一系列用戶對商品的交互組成,其中所述一系列用戶交互為用戶點擊的商品,且所述表示在會話S中第1個被點擊的商品,所述表示在會話S中第2個被點擊的商品,所述表示在會話S中第l個被點擊的商品,所述S的長度是l,表示完成后將每個會話序列構造為一個會話圖Graph,用于通過GNN學習當前會話中商品的Embeddings,其中定義為給定會話設Gs=(Vs,Es)為對應的會話圖,其中Vs為會話S中被點擊的商品的集合,表示商品邊集,其中每條邊表示S中相鄰的兩個商品:通過會話圖構造全局圖,其中所述全局圖用于捕獲全局級別的商品轉換信息,且所述捕獲的信息將用于學習所有會話中的商品嵌入。
8.根據權利要求7所述的基于圖算法的會話推薦系統,其特征在于,通過會話圖構造全局圖,先定義鄰居集為
,
其中是會話Sp中的任意節點,是會話Sq中符合j取值要求的節點,i′是會話Sq中商品所在的次序,ε是一個用于控制會話模型的商品短距離轉換的超參數,調整其取值大小會影響到j的取值范圍,根據鄰居集定義,對每個商品vi∈V全局級商品轉換定義為{(vi,vj)|vi,vj∈V;vj∈Nε(vi)},基于最短路徑改良的鄰接矩陣對于每個節點vi,為相鄰邊生成權重以區分vj鄰居的重要性,同時使用GCN模型,在聚合時加入注意力,在全局圖上傳播特征,根據會話注意力評分對商品進行線性組合,并表示為所述π(vi,vj)表示不同重要性權重,所述為商品vi在圖g中的鄰居集,全局圖中邊(vi,vj)的權重是可訓練的參數,利用注意力機制來學習不同節點之間的權重,權重表示為eij表示節點vj的特征向量對節點vj的特征向量的重要性,使用LeakyRelu作為激活函數,⊙操作符表示對向量逐元素相乘,是激活函數的可自學習的參數向量,對每個商品通過結合全局上下文和會話上下文來獲得它的表示,并且通過總和池來計算最終的會話表示,將會話序列輸入圖神經網絡后獲得會話中S涉及的商品的特征向量表示,同時通過軟注意力機制學習相應的權重βi=qTσ(W1zi+W2s′+b),其中W1、W2是神經網絡可自學習的d×d維矩陣,q和b是神經網絡可自學習的d維向量,q1表示對向量進行轉置操作,zi表示節點的位置信息,s′表示會話S中所有節點所對應特征向量的平均值,σ表示使用sigmoid函數作為激活函數,最后根據線性組合商品來獲得會話表示基于獲得的會話表示S,每個候選商品的最終推薦概率基于初始嵌入以及當前會話表示,首先使用點積,然后應用softmax函數來輸出y,其中輸出y表示為yi=Softmax{SThvi},其中yi表示商品vi在當前會話中出現在下次點擊的概率。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于浙江工業大學,未經浙江工業大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202310440162.6/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種裝配式建筑連接點抗壓檢測器
- 下一篇:孔槽檢測方法、系統、設備及存儲介質





