[發(fā)明專利]一種基于對齊損失的跨領(lǐng)域推薦冷啟動方法在審
| 申請?zhí)枺?/td> | 202211320186.X | 申請日: | 2022-10-26 |
| 公開(公告)號: | CN115600001A | 公開(公告)日: | 2023-01-13 |
| 發(fā)明(設(shè)計)人: | 莊福振;王飛;徐勇軍 | 申請(專利權(quán))人: | 中科(廈門)數(shù)據(jù)智能研究院 |
| 主分類號: | G06F16/9535 | 分類號: | G06F16/9535;G06F16/9536 |
| 代理公司: | 安徽善安知識產(chǎn)權(quán)代理事務(wù)所(特殊普通合伙) 34200 | 代理人: | 劉勇 |
| 地址: | 361021 福建省*** | 國省代碼: | 福建;35 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 對齊 損失 領(lǐng)域 推薦 冷啟動 方法 | ||
本發(fā)明公開了一種基于對齊損失的跨領(lǐng)域推薦冷啟動方法,屬于推薦方法技術(shù)領(lǐng)域,包括建立推薦問題的數(shù)學(xué)模型;建立單域潛在因子模型;計算模型的最小損失函數(shù);利用訓(xùn)練完成的用戶嵌入函數(shù)將用戶從源域嵌入到目標域,創(chuàng)建編碼?解碼框架,聯(lián)合重疊數(shù)據(jù)和非重疊數(shù)據(jù),構(gòu)建低維損失訓(xùn)練模型。本發(fā)明所述的基于對齊損失的跨領(lǐng)域推薦冷啟動方法通過采用自動編碼器?自動解碼器框架將源域和目標域形成全連接的網(wǎng)絡(luò),再將源域和目標域中的數(shù)據(jù)進行降維,創(chuàng)建降維映射函數(shù),避免嵌入高維映射函數(shù)在重疊用戶和歷史數(shù)據(jù)較少的情況下嵌入難度大的問題,同時對降維后的源域和目標域損失進行重疊用戶對齊,有效緩解跨領(lǐng)域冷啟動,提高跨領(lǐng)域推薦的性能。
技術(shù)領(lǐng)域
本發(fā)明涉及一種推薦冷啟動方法,特別是涉及一種基于對齊損失的跨領(lǐng)域推薦冷啟動方法,屬于推薦方法技術(shù)領(lǐng)域。
背景技術(shù)
在網(wǎng)絡(luò)信息膨脹的互聯(lián)網(wǎng)時代,有效的推薦系統(tǒng)在各行各業(yè)為生產(chǎn)和生活提供了便利,能夠為人們高效提取感興趣的信息,跨領(lǐng)域推薦能夠從各個不同的域提取用戶的評價記錄、反饋信息、檢索記錄以及點擊信息提取用戶感興趣的數(shù)據(jù),再向用戶進行推送,在用戶沒有歷史數(shù)據(jù)或者很少的數(shù)據(jù)信息時,跨領(lǐng)域推薦的冷啟動就成了推薦系統(tǒng)較難克服的問題。
現(xiàn)在的跨領(lǐng)域推薦模型將冷啟動用戶嵌入映射到目標域時,嵌入維度過大,高維函數(shù)作為映射函數(shù)的輸入和輸出函數(shù)給推薦模型的優(yōu)化帶來困難,同時,源域和目標域的重疊用戶數(shù)量少會導(dǎo)致跨領(lǐng)域推薦冷啟動的映射函數(shù)訓(xùn)練不足,無法充分對映射函數(shù)進行充分訓(xùn)練,使得映射函數(shù)的推廣性能變差。
因此,找到一種基于對齊損失的跨領(lǐng)域推薦冷啟動方法,降低映射函數(shù)維度并實現(xiàn)低維空間重疊用戶對齊,就能夠在重疊用戶不多的前提下緩解跨域推薦冷啟動,有效提高跨領(lǐng)域推薦的性能,降低高維映射函數(shù)嵌入的難度。
發(fā)明內(nèi)容
本發(fā)明的主要目的是為了解決現(xiàn)有的跨域推薦在重疊用戶少且歷史數(shù)據(jù)不足時,因為高維映射函數(shù)嵌入困難導(dǎo)致跨領(lǐng)域推薦性能變差以及映射函數(shù)訓(xùn)練不足的問題,而提供的一種基于對齊損失的跨領(lǐng)域推薦冷啟動方法。
本發(fā)明的目的可以通過采用如下技術(shù)方案達到:
一種基于對齊損失的跨領(lǐng)域推薦冷啟動方法,包括如下步驟:
A1、建立推薦問題的數(shù)學(xué)模型:創(chuàng)建源域和目標域數(shù)據(jù)集,并將源域記為S,目標域記為T,源域和目標域均創(chuàng)建項目集V、用戶集 U以及評價矩陣T,將rij記為評價矩陣中用戶ui對項目vj的評分,源域的項目集、用戶集和評價矩陣記為VT、UT和RT,目標域的項目集、用戶集合評價矩陣記為VS、US和RS,在UT和US存在重疊用戶,并將重疊用戶集記為Uo,而在冷啟動問題中所設(shè)置的目標用戶是不屬于源域用戶集UT且屬于目標域用戶集US的用戶;
A2、建立單域潛在因子模型:在源域中,將用戶的嵌入和項目的嵌入分別記為和其中d記為嵌入的大小,建立評價矩陣中rij的概率模型;
A3、計算模型的最小損失函數(shù):利用極大似然法對rij進行評估,求解最小損失,并利用這種估計方法對源域和目標域分別訓(xùn)練出相互獨立的概率模型;
A4、利用訓(xùn)練完成的用戶嵌入函數(shù)將用戶從源域嵌入到目標域,創(chuàng)建編碼-解碼框架,聯(lián)合重疊數(shù)據(jù)和非重疊數(shù)據(jù),構(gòu)建低維損失訓(xùn)練模型:將源域連接第一層自動編碼器和,將目標域連接第二層自動編碼器,第一層自動編碼器和第二層自動編碼器分別連接有第一層自動解碼器和第二層自動解碼器,利用第一層自動編碼器、第二層自動編碼器、第一層自動解碼器和第二層自動解碼器構(gòu)建完全連接的網(wǎng)絡(luò),利用第一編碼器和第二編碼器提取源域和目標域中的不變因素,計算重疊用戶的低維對齊損失;
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于中科(廈門)數(shù)據(jù)智能研究院,未經(jīng)中科(廈門)數(shù)據(jù)智能研究院許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202211320186.X/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





