[發(fā)明專利]一種基于變分自編碼數(shù)據(jù)融合的網(wǎng)站推薦方法和設(shè)備在審
| 申請?zhí)枺?/td> | 202011249317.0 | 申請日: | 2020-11-10 |
| 公開(公告)號: | CN112231582A | 公開(公告)日: | 2021-01-15 |
| 發(fā)明(設(shè)計)人: | 李文中;王品皓;余澤鵬;張淋洺;陸桑璐 | 申請(專利權(quán))人: | 南京大學(xué) |
| 主分類號: | G06F16/9535 | 分類號: | G06F16/9535;G06F16/958;G06N3/04;G06N3/08 |
| 代理公司: | 南京泉為知識產(chǎn)權(quán)代理事務(wù)所(特殊普通合伙) 32408 | 代理人: | 許丹丹 |
| 地址: | 210023 江蘇*** | 國省代碼: | 江蘇;32 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 編碼 數(shù)據(jù) 融合 網(wǎng)站 推薦 方法 設(shè)備 | ||
1.一種基于變分自編碼數(shù)據(jù)融合的網(wǎng)站推薦方法,其特征在于,該方法包括以下步驟:
S1、數(shù)據(jù)的預(yù)處理,根據(jù)用戶的網(wǎng)站瀏覽信息構(gòu)建兩個二維矩陣,兩個矩陣分別是用戶和網(wǎng)站的交互矩陣和邊信息矩陣;
S2、模型訓(xùn)練,將用戶和網(wǎng)站的交互向量和邊信息向量拼接起來作為神經(jīng)網(wǎng)絡(luò)模型的輸入向量,經(jīng)過損壞處理后輸入到神經(jīng)網(wǎng)絡(luò)模型,根據(jù)變分自編碼器的目標(biāo)函數(shù)對神經(jīng)網(wǎng)絡(luò)模型進(jìn)行優(yōu)化;
S3、模型使用,將目標(biāo)用戶的網(wǎng)站瀏覽信息轉(zhuǎn)換為交互向量和邊信息向量,輸入到訓(xùn)練好的變分自編碼器模型中,經(jīng)過編碼階段以及解碼階段獲得最終輸出,對輸出向量各維度的元素進(jìn)行排序,并移除用戶已經(jīng)訪問過的網(wǎng)站對應(yīng)的元素,利用排名前k的元素對應(yīng)的網(wǎng)站作為推薦結(jié)果。
2.根據(jù)權(quán)利要求1所述的基于變分自編碼數(shù)據(jù)融合的網(wǎng)站推薦方法,其特征在于,所述步驟S1包括:將用戶的網(wǎng)站瀏覽信息轉(zhuǎn)化為用戶和網(wǎng)站的交互矩陣,分別是交互矩陣Y和邊信息矩陣U,交互矩陣中第u行、第i列的元素yui表示用戶u是否訪問過網(wǎng)站i,若訪問過yui=1,否則yui=0;邊信息矩陣中第u行、第i列的元素rui是用戶u訪問網(wǎng)站i的相關(guān)屬性值的加權(quán)和,稱為邊信息。
3.根據(jù)權(quán)利要求2所述的基于變分自編碼數(shù)據(jù)融合的網(wǎng)站推薦方法,其特征在于,所述邊信息公式如下:
rui=weight1*ui1/Mu1+…+weightk*uik/Muk
rui表示邊信息矩陣中第u行、第i列的元素,Muk表示用戶u和所有網(wǎng)站的訪問信息中第k個屬性的最大值,uik表示用戶u和網(wǎng)站i的訪問信息中的第k個屬性,weightk表示第k個屬性的權(quán)值。
4.根據(jù)權(quán)利要求2所述的基于變分自編碼數(shù)據(jù)融合的網(wǎng)站推薦方法,其特征在于,所述步驟S2中模型的輸入向量通過以下方法得到:
對于用戶u,取交互矩陣和邊信息矩陣的第u行,得到交互向量Yu和邊信息向量Ru,兩個向量均是N維向量,N為網(wǎng)站的數(shù)量;
對交互向量Yu和邊信息向量Ru進(jìn)行損壞處理,得到損壞處理后的交互向量和損壞處理后的邊信息向量將拼接起來作為模型的輸入向量
5.根據(jù)權(quán)利要求1所述的基于變分自編碼數(shù)據(jù)融合的網(wǎng)站推薦方法,其特征在于,所述步驟S2中神經(jīng)網(wǎng)絡(luò)模型的計算過程如下:
其中hi是神經(jīng)網(wǎng)絡(luò)第i層的輸出,Wi是第i層的權(quán)值矩陣,bi是第i層的偏置向量,μ對應(yīng)隱變量分布的均值,σ對應(yīng)隱變量分布的標(biāo)準(zhǔn)差,是經(jīng)過損壞處理后的交互向量,經(jīng)過損壞處理后的邊信息向量;
其中是模型對輸入的交互向量Yu的重構(gòu),zu為隱變量;經(jīng)過softmax層后,得到最終的輸出向量output。
6.根據(jù)權(quán)利要求5所述的基于變分自編碼數(shù)據(jù)融合的網(wǎng)站推薦方法,其特征在于,所述步驟S2中變分自編碼器的目標(biāo)函數(shù)如下:
目標(biāo)函數(shù)包括兩項,左邊的項使模型增加重構(gòu)輸入的交互向量Yu的可能性,右邊的項使條件分布盡可能地近似先驗分布p(zu),先驗分布為標(biāo)準(zhǔn)高斯分布,表示利用由分布產(chǎn)生的zu來計算logpθ(Yu|zu),θ表示解碼器部分的模型參數(shù),φ表示編碼器部分的模型參數(shù),是模型編碼器部分學(xué)得的由輸入向量到隱變量的條件分布,KL表示計算兩個分布的相對熵,兩個分布之間利用||進(jìn)行分隔。
7.一種計算機設(shè)備,其特征在于,所述設(shè)備包括:
一個或多個處理器;
存儲器;
以及一個或多個程序,其中所述一個或多個程序被存儲在所述存儲器中,并且被配置成由所述一個處理器執(zhí)行,所述程序被處理器執(zhí)行時實現(xiàn)如權(quán)利要求1-6中的任一項所述方法的步驟。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于南京大學(xué),未經(jīng)南京大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011249317.0/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 數(shù)據(jù)顯示系統(tǒng)、數(shù)據(jù)中繼設(shè)備、數(shù)據(jù)中繼方法、數(shù)據(jù)系統(tǒng)、接收設(shè)備和數(shù)據(jù)讀取方法
- 數(shù)據(jù)記錄方法、數(shù)據(jù)記錄裝置、數(shù)據(jù)記錄媒體、數(shù)據(jù)重播方法和數(shù)據(jù)重播裝置
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)發(fā)送系統(tǒng)、數(shù)據(jù)發(fā)送裝置以及數(shù)據(jù)結(jié)構(gòu)
- 數(shù)據(jù)顯示系統(tǒng)、數(shù)據(jù)中繼設(shè)備、數(shù)據(jù)中繼方法及數(shù)據(jù)系統(tǒng)
- 數(shù)據(jù)嵌入裝置、數(shù)據(jù)嵌入方法、數(shù)據(jù)提取裝置及數(shù)據(jù)提取方法
- 數(shù)據(jù)管理裝置、數(shù)據(jù)編輯裝置、數(shù)據(jù)閱覽裝置、數(shù)據(jù)管理方法、數(shù)據(jù)編輯方法以及數(shù)據(jù)閱覽方法
- 數(shù)據(jù)發(fā)送和數(shù)據(jù)接收設(shè)備、數(shù)據(jù)發(fā)送和數(shù)據(jù)接收方法
- 數(shù)據(jù)發(fā)送裝置、數(shù)據(jù)接收裝置、數(shù)據(jù)收發(fā)系統(tǒng)、數(shù)據(jù)發(fā)送方法、數(shù)據(jù)接收方法和數(shù)據(jù)收發(fā)方法
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)再現(xiàn)方法、數(shù)據(jù)發(fā)送裝置及數(shù)據(jù)再現(xiàn)裝置
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)再現(xiàn)方法、數(shù)據(jù)發(fā)送裝置及數(shù)據(jù)再現(xiàn)裝置





