[發明專利]一種基于變分自動編碼器的混合推薦方法有效
| 申請號: | 201810253803.6 | 申請日: | 2018-03-26 |
| 公開(公告)號: | CN108647226B | 公開(公告)日: | 2021-11-02 |
| 發明(設計)人: | 張寅;林建實 | 申請(專利權)人: | 浙江大學 |
| 主分類號: | G06F16/9535 | 分類號: | G06F16/9535;G06Q30/06;G06N3/04;G06N3/08 |
| 代理公司: | 杭州求是專利事務所有限公司 33200 | 代理人: | 傅朝棟;張法高 |
| 地址: | 310058 浙江*** | 國省代碼: | 浙江;33 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 自動 編碼器 混合 推薦 方法 | ||
本發明公開了一種基于變分自動編碼器的混合推薦方法。方法通過使用變分自動編碼器對用戶和物品的評分特征和內容特征進行建模,通過因子分解機對稀疏特征進行編碼,自動進行特征高階組合;同時,將用戶和物品的多視圖數據特征融合到變分自動編碼器的架構里,以解決冷啟動問題;并且通過用戶和物品的隱向量編碼的變分推斷分析,為自動編碼器生成隱向量編碼提供了解釋性;通過輸入用戶和物品相對應的特征,能夠獲取到用戶對候選物品集合的偏好值,根據偏好值進行排序得到推薦結果。本發明相對于傳統推薦方法能夠有更好的推薦效果。
技術領域
本發明涉及計算機推薦系統,尤其涉及一種基于自動編碼器的混合推薦方法。
背景技術
近年來,隨著網絡和信息技術的不斷發展,線上信息的數據體量、產生速度以及復雜度都在迅速增加,個性化推薦系統已經成為了從繁瑣復雜數據中提取信息的重要技術手段,并被廣泛應用于工業界中。
傳統的基于協同過濾的推薦方法,特別是矩陣分解系列的方法在工業界已經被證明是十分有效的,盡管隱式反饋數據如瀏覽、點擊和收藏,相對于顯式反饋數據如電影評分、商品評價等,更加容易收集,但是冷啟動問題和特征的稀疏性問題仍然是限制推薦系統性能的重要因素。
而近幾年來深度學習在圖形圖像和自然語言處理等領域都取得了突破性的進展,證明了其在特征處理方面的優秀性能,因此,將深度學習應用在推薦系統上已經成為了該領域內的一個重要方向。但是現有的基于深度神經網絡的模型往往都是對用戶和物品的內容特征進行處理,而推薦系統的關鍵是刻畫用戶與物品的交互關系,在這一點上并沒有直接應用深度學習的研究,更多的還是直接利用生成的隱向量編碼輸入再到矩陣分解框架里。
發明內容
針對現有的技術空白和缺點,本發明提供了一種基于變分自動編碼器的混合推薦方法。本發明具體采用的技術方案如下:
基于變分自動編碼器的混合推薦方法,其包括以下步驟:
(1)根據具體的應用配置環境,處理日志數據,得到用戶和物品的交互關系信息,包括隱式反饋和顯式反饋兩類;針對不同信息類型進行特征處理:對于隱式反饋數據,有交互行為的標記為1,否則標記為0;對于顯示反饋數據,記錄其具體的評分值,然后將特征值進行歸一化處理;
(2)分別收集用戶和物品的多視圖信息,包括用戶畫像信息和物品內容信息,解決冷啟動問題;
(3)收集用戶除已有歷史行為的物品之外的不喜愛偏好的推薦反饋信息,生成負樣本,再利用負采樣使得整體正負樣本數相同;
(4)構建基于變分自動編碼器混合推薦方法的模型,采用交替迭代的方式進行變量的梯度更新,對模型進行訓練,保存最終的模型參數;對于已有歷史交互行為的物品和用戶,保留對應的隱向量編碼;
(5)在預測階段,對于已經有隱向量編碼的用戶和物品,直接作為模型中廣義矩陣分解模塊的輸入,計算得到該用戶對特定物品的偏好值;而對于缺失隱向量編碼的用戶和物品,則首先通過訓練好的模型計算出對應的隱向量編碼,再計算其偏好值;
(6)對于特定某用戶,計算其對候選物品集合中物品的偏好值,對偏好值進行排序,得到該用戶的推薦物品列表;
在方法執行過程中,定期整理日志并重復(1)~(4)計算模型,更新用戶和物品的隱向量編碼。
作為優選,所述步驟(3)包括:針對每一個用戶,根據已有的交互行為將物品劃分成為正樣本和負樣本,而對于沒有交互記錄的物品,通過抽樣的方式來篩選出一部分的負樣本。
作為優選,所述的步驟(4)中的基于變分自動編碼器混合推薦方法的模型一共由三個模塊組成,包括用戶一側的變分自動編碼器,物品一側的變分自動編碼器和廣義矩陣分解模塊,變分自動編碼器分為解碼器和編碼器;在接收了前述步驟(2)、(3)、(4)得到的用戶和物品特征值以及對應的正負樣本偏好值之后,進行模型的訓練。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于浙江大學,未經浙江大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810253803.6/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種電商黑灰產輿情自動挖掘方法和系統
- 下一篇:一種推薦方法及裝置





