[發(fā)明專利]一種基于堆疊自編碼器的跨域推薦方法有效
| 申請?zhí)枺?/td> | 202011009508.X | 申請日: | 2020-09-23 |
| 公開(公告)號: | CN112149734B | 公開(公告)日: | 2022-04-05 |
| 發(fā)明(設(shè)計)人: | 曲立平;任建南 | 申請(專利權(quán))人: | 哈爾濱工程大學 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62;G06N3/04;G06N3/08;G06F16/9535;G06F16/958 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 150001 黑龍江省哈爾濱市南崗區(qū)*** | 國省代碼: | 黑龍江;23 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 堆疊 編碼器 推薦 方法 | ||
本發(fā)明屬于跨域推薦算法技術(shù)領(lǐng)域,具體涉及一種基于堆疊自編碼器的跨域推薦方法。本發(fā)明針對純跨域推薦存在的數(shù)據(jù)稀疏性問題,提供可提高推薦的評分預測精準度和分類精準度一種基于堆疊自編碼器的跨域推薦方法。本發(fā)明對基于用戶的跨域堆疊自編碼器和基于項目的跨域堆疊自編碼器兩個模型同時學習并對學習結(jié)果進行比較,選出最優(yōu)的推薦結(jié)果,從而提高推薦的評分預測精準度和分類精準度。本發(fā)明將跨域信息引入自動編碼器中,以了解用戶和商品的更深層的非線性網(wǎng)絡(luò)結(jié)構(gòu)。發(fā)明通過對目標域用戶向量的擴展,并且結(jié)合深度學習有效地解決了稀疏性問題,在評分預測和Top?n推薦方面優(yōu)于其他模型。
技術(shù)領(lǐng)域
本發(fā)明屬于跨域推薦算法技術(shù)領(lǐng)域,具體涉及一種基于堆疊自編碼器的跨域推薦方法。
背景技術(shù)
隨著大數(shù)據(jù)和互聯(lián)網(wǎng)技術(shù)的飛速發(fā)展,網(wǎng)絡(luò)中各種應(yīng)用生成的數(shù)據(jù)呈爆炸性增長,導致嚴重的信息過載問題。用戶從大量資源(例如文本,圖像,視頻和商品)中找到滿足其個性化需求的信息已經(jīng)變得非常困難。推薦系統(tǒng)是解決上述問題的關(guān)鍵技術(shù)之一。與搜索引擎不同,推薦系統(tǒng)研究用戶的歷史行為數(shù)據(jù),進行統(tǒng)計并分析他們的興趣和偏好,從而引導用戶找到自己的信息需求并實現(xiàn)個性化推薦。目前,該技術(shù)被廣泛應(yīng)用于電子商務(wù),社交網(wǎng)絡(luò),新聞源,視頻網(wǎng)站等領(lǐng)域。目前,推薦系統(tǒng)主要用于兩個任務(wù)。首先,它們用于預測給定項目對用戶的效用。在此任務(wù)中,用戶首先選擇他們感興趣的項目,推薦系統(tǒng)然后預測用戶將對項目給予的評分。其次,推薦系統(tǒng)用于向用戶推薦項目列表。在這種情況下,系統(tǒng)選擇最相關(guān)的項目列表推薦給用戶。
傳統(tǒng)的個性化推薦系統(tǒng)基于單領(lǐng)域,即根據(jù)用戶對某個域的偏好功能在域中為用戶提供推薦服務(wù)。但是,隨著用戶和項目規(guī)模的快速增長,傳統(tǒng)推薦算法的缺陷逐漸暴露出來。在大多數(shù)推薦系統(tǒng)中,每個用戶僅對少量項目進行評分,評分矩陣中超過90%的評分為空。在這種情況下,要查找不同用戶或項目之間的相似性是一個挑戰(zhàn),這種類型的問題稱為稀疏性。冷啟動問題是稀疏性的特例,它主要包括如何推薦尚未交互任何項目的新用戶,以及如何處理從未評分或購買過的項目。稀疏性和冷啟動問題導致推薦的性能下降,從而阻礙了算法的進一步推廣。研究表明,來自不同領(lǐng)域(電影和書籍)或不同平臺(社交媒體和電子商務(wù))的用戶興趣偏好或項目功能之間存在強烈的相關(guān)性和依賴性?;谶@種現(xiàn)象,學術(shù)界提出了跨域推薦技術(shù):從其他領(lǐng)域獲得有效的用戶偏好或項目特征,以豐富目標域中的數(shù)據(jù),準確地預測用戶行為,并提供更合理和個性化的推薦服務(wù)。在過去的十年中,有關(guān)跨域推薦的相關(guān)研究取得了很大的進步。跨域推薦是Winoto和Tang在2008年中首次提出的。他們認為,雖然跨域推薦不如單領(lǐng)域推薦準確,但可能會使推薦結(jié)果更加多樣化??缬蛲扑]使用兩個不同域中的相似性將源域的數(shù)據(jù)遷移到目標域,從而提高了目標域的準確性和多樣性。
自編碼器(autoencoder,AE)是一類在半監(jiān)督學習和非監(jiān)督學習中使用的人工神經(jīng)網(wǎng)絡(luò)(Artificial Neural Networks,ANNs),其功能是通過將輸入信息作為學習目標,對輸入信息進行表征學習(representation learning)。自編碼器包含編碼器(encoder)和解碼器(decoder)兩部分。自編碼器具有一般意義上表征學習算法的功能,通常被應(yīng)用于降維(dimensionality reduction)和異常值檢測(anomaly detection)。近些年深度學習的廣泛應(yīng)用,自編碼器與推薦系統(tǒng)的結(jié)合也成為了推薦領(lǐng)域的新的研究方向。與傳統(tǒng)的推薦方法相比,基于自編碼器的推薦算法通過結(jié)合底層特征形成了更密集的高層語義抽象,從而自動發(fā)現(xiàn)數(shù)據(jù)的分布式特征表示,更好地提取用戶和項目的特征,解決了傳統(tǒng)推薦算法中人為設(shè)計特征的問題。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于哈爾濱工程大學,未經(jīng)哈爾濱工程大學許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011009508.X/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類





