[發明專利]一種基于變分自編碼數據融合的網站推薦方法和設備在審
| 申請號: | 202011249317.0 | 申請日: | 2020-11-10 |
| 公開(公告)號: | CN112231582A | 公開(公告)日: | 2021-01-15 |
| 發明(設計)人: | 李文中;王品皓;余澤鵬;張淋洺;陸桑璐 | 申請(專利權)人: | 南京大學 |
| 主分類號: | G06F16/9535 | 分類號: | G06F16/9535;G06F16/958;G06N3/04;G06N3/08 |
| 代理公司: | 南京泉為知識產權代理事務所(特殊普通合伙) 32408 | 代理人: | 許丹丹 |
| 地址: | 210023 江蘇*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 編碼 數據 融合 網站 推薦 方法 設備 | ||
本發明公開了一種基于變分自編碼數據融合的網站推薦方法和設備,所述方法基于協同過濾方法與神經網絡、變分自編碼器、邊信息提取方法,實現了網站推薦,模型構建中將邊信息提取與變分自編碼器相結合來完成附帶排名信息的網站推薦任務,因為提取了隱式反饋數據中的邊信息,模型輸入的信息更加全面。本發明具有良好的網站推薦效果。
技術領域
本發明涉及神經網絡、變分自動編碼器、網站推薦、邊信息提取,具體涉及一種基于變分自編碼器的網站推薦方法。
背景技術
互聯網中的信息量不斷增大,在網絡中過濾信息所需的工作量也隨之增大,搜索引擎可以在用戶目標明確的情況下幫助用戶找到有用信息,推薦系統則根據用戶過去的行為去發掘用戶可能感興趣的信息。協同過濾技術被廣泛應用到推薦系統中,很多年來協同過濾始終是一個受研究人員關注的研究方向。傳統的協同過濾方法可被分為兩類,基于近鄰的方法和潛在因素模型方法。基于近鄰的方法通過提前定義好的相似度計算方法找到用戶的或項的近鄰,之后基于近鄰來進行預測。潛在因素模型的典型方法是矩陣分解方法,該方法將用戶和項投影到一個聯合向量空間,用代表用戶的向量和代表項的向量的內積來表示用戶和項的交互信息。近些年隨著深度學習的發展,神經網絡被應用到推薦系統中,基于神經網絡實現的生成模型的目標與協同過濾方法的目標存在著很大的相似性。玻爾茲曼機、自編碼器、降噪自編碼器以及變分自編碼器被研究人員應用到推薦系統中,神經網絡將非線性引入到模型中,相比于傳統的線性模型,非線性模型具有更強的表達能力,實驗結果也顯示,非線性模型通常具有更好的表現。然而,根據當前署名發明人的工作發現,已有的基于變分自編碼的推薦方法對輸入信息進行處理的過程中,其利用的信息僅包含下文提到的交互信息,這造成了很大程度上的信息損失,因此并不能得到優秀的推薦結果。
發明內容
為提升網站推薦系統的表現,本發明提出了基于變分自編碼數據融合的網站推薦方法及設備,將提取的邊信息融入到輸入信息中,在減少輸入信息損失的同時,提升了推薦效果。
為了實現上述發明目的,本發明采用如下的技術方案:
根據用戶過去的網站瀏覽記錄,來預測用戶可能感興趣的網站,同時提升推薦效果,第一方面,本發明提出一種基于變分自編碼數據融合的網站推薦方法,包括以下步驟:
S1、數據的預處理,根據用戶的網站瀏覽信息構建兩個二維矩陣,兩個矩陣分別是用戶和網站的交互矩陣和邊信息矩陣;
S2、模型訓練,將用戶和網站的交互向量和邊信息向量拼接起來作為神經網絡模型的輸入向量,經過損壞處理后輸入到神經網絡模型,根據變分自編碼器的目標函數對神經網絡模型進行優化;
S3、模型使用,將目標用戶的網站瀏覽信息轉換為交互向量和邊信息向量,輸入到訓練好的變分自編碼器模型中,經過編碼階段以及解碼階段獲得最終輸出,對輸出向量各維度的元素進行排序,并移除用戶已經訪問過的網站對應的元素,利用排名前k的元素對應的網站作為推薦結果。
其中,交互矩陣Y中第u行、第i列的元素yui表示用戶u是否訪問過網站i,若訪問過yui=1,否則yui=0;邊信息矩陣R中第u行、第i列的元素rui是用戶u訪問網站i的相關屬性值的加權和,稱為邊信息。
所述變分自編碼器的目標函數如下:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于南京大學,未經南京大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011249317.0/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種光纖連接器防塵帽的制備工藝
- 下一篇:攝像模組、制造方法及電子設備
- 數據顯示系統、數據中繼設備、數據中繼方法、數據系統、接收設備和數據讀取方法
- 數據記錄方法、數據記錄裝置、數據記錄媒體、數據重播方法和數據重播裝置
- 數據發送方法、數據發送系統、數據發送裝置以及數據結構
- 數據顯示系統、數據中繼設備、數據中繼方法及數據系統
- 數據嵌入裝置、數據嵌入方法、數據提取裝置及數據提取方法
- 數據管理裝置、數據編輯裝置、數據閱覽裝置、數據管理方法、數據編輯方法以及數據閱覽方法
- 數據發送和數據接收設備、數據發送和數據接收方法
- 數據發送裝置、數據接收裝置、數據收發系統、數據發送方法、數據接收方法和數據收發方法
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置





