[發明專利]一種基于層次注意力機制的社交圖像推薦方法在審
| 申請號: | 201811200827.1 | 申請日: | 2018-10-16 |
| 公開(公告)號: | CN109410080A | 公開(公告)日: | 2019-03-01 |
| 發明(設計)人: | 吳樂;陳雷;汪萌;洪日昌;楊永暉 | 申請(專利權)人: | 合肥工業大學 |
| 主分類號: | G06Q50/00 | 分類號: | G06Q50/00;G06N3/04;G06F16/9535 |
| 代理公司: | 安徽省合肥新安專利代理有限責任公司 34101 | 代理人: | 陸麗莉;何梅生 |
| 地址: | 230009 安*** | 國省代碼: | 安徽;34 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 矩陣 圖像 嵌入 注意力機制 語義信息 異構數據 上傳 注意力 矩陣輸入 評分矩陣 權值計算 社交關系 社交信息 數據稀疏 特征矩陣 信息矩陣 選擇圖像 影響用戶 用戶喜好 有效解決 圖像集 頂層 網絡 預測 風格 | ||
1.一種基于層次注意力機制的社交圖像推薦方法,其特征是按如下步驟進行:
步驟1、構造異構數據,包括:用戶對圖像的評分矩陣R、用戶對圖像的上傳信息矩陣L、用戶與用戶之間的社交關系矩陣S:
令U表示用戶集,且U={u1,...,ua,...,ub,...,uM},ua表示第a個用戶,ub表示第b個用戶,M表示用戶總數,1≤a,b≤M;令V表示圖像集,且V={v1,...,vi,...,vj,...,vN},vi表示第i個圖像,vj表示第j個圖像,N表示圖像總數,1≤i,j≤N;令Rai表示第a個用戶ua對第i個圖像vi的評分值,則用戶對圖像的評分矩陣R={Rai}M×N;令Lai表示第a個用戶ua對第i個圖像vi的上傳信息,則用戶對圖像的上傳信息矩陣L={Lai}M×N;令Sab表示第a個用戶ua對第b個用戶的ub的社交關系,則用戶與用戶之間的社交關系矩陣S={Sab}M×M;
步驟2、對所述異構數據和圖像集V處理得到社交嵌入矩陣E、內容嵌入矩陣Fc和風格嵌入矩陣Fs:
步驟2.1、通過隨機游走算法對社交關系矩陣S進行處理,得到社交嵌入矩陣E;
步驟2.2、通過深度卷積神經網絡模型VGG提取圖像的視覺特征:
選取所述深度卷積神經網絡模型VGG的最后一個全連接層的輸出Fc作為第i個圖像vi的內容嵌入向量Fic,從而得到全部圖像的內容嵌入矩陣Fc;
假設第m個卷積層有Nm個濾波器,每個濾波器大小為Mm,則所述深度卷積神經網絡模型VGG的第m個卷積層特征的Gram矩陣
利用式(1)計算第m個卷積層第p個濾波器和第q個濾波器之間特征映射關系
式(1)中,表示第m個卷積層第p個濾波器第k個位置的激勵值,表示第m個卷積層第q個濾波器第k個位置的激勵值,1≤p,q≤Nm,1≤k≤Mm;
利用式(2)得到第i個圖像的風格嵌入向量Fis,從而得到全部圖像的風格嵌入矩陣Fs:
Fis=[v(G1),...,v(Gl),...,v(G5)] (2)
式(2)中,v(Gm)表示第m個卷積層特征的Gram矩陣Gl的矢量化;
步驟3、將社交嵌入矩陣E、內容嵌入矩陣Fc和風格嵌入矩陣Fs輸入到底層注意力網絡中得到影響用戶對圖片選擇的三個方面的社交語義信息:
步驟3.1、計算用戶的上傳一致性
步驟3.1.1、令La表示第a個用戶ua上傳的圖像集,則利用式(3)得到第j個圖像vj在計算第a個用戶ua的上傳一致性時所占的權值αaj:
式(3)中,σ(·)表示sigmoid函數;Pa和Qa分別是第a個用戶ua的基礎特征向量和輔助特征向量,Wj和Xj分別是第j個圖像vj的基礎特征向量和輔助特征向量;Ea是第a個用戶ua的社交嵌入向量;和分別是第j個圖像vj的內容嵌入向量和風格嵌入向量;θu=[w2,W1,Wc,Ws]是第一底層注意力網絡BotNet1的參數,其中w2是第一個sigmoid函數的參數,W1是第一個矩陣參數,Wc是對內容嵌入矩陣Fc進行降維的參數,Ws是對風格嵌入矩陣Fs進行降維的參數;是第a個用戶ua喜歡的圖像內容嵌入矩陣,并通過式(4)獲得;是第a個用戶ua喜歡的圖像風格嵌入矩陣,并通過式(5)獲得;
步驟3.1.2、對所述第j張圖像vj在計算第a個用戶ua的上傳一致性時所占的權值αaj進行歸一化處理,通過式(6)得到歸一化后的權值
步驟3.1.3、利用式(7)得到第a個用戶ua的上傳一致性
步驟3.2、計算第a個用戶ua的社交影響力
步驟3.2.1、令Sa表示與第a個用戶ua有社交關系的用戶集,則利用式(8)得到第b個用戶ub在計算第a個用戶ua的社交影響力時所占的權值βab:
βab=σ(w4×(W3×[Pa,Pb,Qa,Qb,Ea,Eb,Fac,Fas])) (8)
式(7)中,Pb和Qb分別是第b個用戶ub的基礎特征向量和輔助特征向量;Eb是第b個用戶ub的社交嵌入向量;和分別是第a個用戶ua的喜歡的圖像集的內容嵌入矩陣和風格嵌入矩陣;θs=[w4,W3]是第二底層注意力網絡BotNet2的參數,其中w4是第二個sigmoid函數的參數,W3是第二個矩陣參數;
步驟3.2.2、對所述第b個用戶ub在計算第a個用戶ua的社交影響力時所占的權值βab進行歸一化處理,通過式(9)得到歸一化后的權值
步驟3.2.3、根據式(10)得到第a個用戶ua的社交影響力
步驟3.3、令Ci表示第i個圖像vi的上傳者,且每個圖像只有一個上傳者,從而將第i個圖像vi的上傳者影響力表示為第i個圖像vi的上傳者Ci的輔助嵌入向量QCi;
以所述上傳一致性、社交影響力和上傳者影響力作為三個方面的社交語義信息;
步驟4、利用式(11)分別得到頂層注意力網絡TopNet的三個輸入Aλ,λ=1,2,3:
利用式(12)得到三個方面的社交語義信息分別在影響第a個用戶ua選擇圖像時所占的權值γaλ:
γaλ=σ(w6×(W5×Aλ)) (12)
式(12)中,θa=[w6,W5]是頂層注意力網絡的參數,w6是第三個sigmoid函數的參數,W5是第三個矩陣參數;
步驟5、根據三個方面的社交語義信息及其所占的權值計算用戶對圖像的評分預測值,從而對用戶進行圖像推薦:
步驟5.1、根據式(13)得到第a個用戶ua和第i個圖像vi對應的預測評分從而得到用戶對物品的評分預測矩陣
式(13)中,WiT是第i個圖像vi的基礎特征向量的轉置向量;
步驟5.2、建立如式(14)所示的損失函數L(θ):
式(13)中,θ=[θ1,θ2]是待優化的參數,θ1=[P,Q,W,X]是特征矩陣,θ2=[θu,θs,θa]是注意力網絡的參數,λ是正則化項,Da={(i,j)|i∈Ra∧j∈V-Ra}是第a個用戶ua的訓練數據,Ra是第a個用戶ua喜歡的圖像集;
步驟5.3、通過隨機梯度下降法對所述損失函數L(θ)進行優化求解,使得L(θ)達到最小,從而得到最優預測評分矩陣,并根據所最優預測評分矩陣對用戶進行圖像推薦。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于合肥工業大學,未經合肥工業大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811200827.1/1.html,轉載請聲明來源鉆瓜專利網。
- 彩色圖像和單色圖像的圖像處理
- 圖像編碼/圖像解碼方法以及圖像編碼/圖像解碼裝置
- 圖像處理裝置、圖像形成裝置、圖像讀取裝置、圖像處理方法
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序以及圖像解碼程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序、以及圖像解碼程序
- 圖像形成設備、圖像形成系統和圖像形成方法
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序





