[發(fā)明專利]具有多個輔助域的跨域推薦數(shù)據(jù)處理方法、跨域推薦系統(tǒng)在審
| 申請?zhí)枺?/td> | 201811402203.8 | 申請日: | 2018-11-23 |
| 公開(公告)號: | CN109711925A | 公開(公告)日: | 2019-05-03 |
| 發(fā)明(設(shè)計)人: | 喬慧;沈玉龍;董學(xué)文;姜曉鴻;佟威;劉洋洋;馬詩洋;谷鑫雨;楊凌霄;趙六順 | 申請(專利權(quán))人: | 西安電子科技大學(xué) |
| 主分類號: | G06Q30/06 | 分類號: | G06Q30/06;G06K9/62 |
| 代理公司: | 西安長和專利代理有限公司 61227 | 代理人: | 黃偉洪 |
| 地址: | 710071 陜西省*** | 國省代碼: | 陜西;61 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 評分矩陣 跨域 數(shù)據(jù)處理 矩陣分解 聚類算法 推薦系統(tǒng) 冷啟動 聚類 平均絕對誤差 數(shù)據(jù)處理系統(tǒng) 信息處理技術(shù) 準(zhǔn)確度 電子商務(wù) 分解目標(biāo) 模型預(yù)測 評估預(yù)測 數(shù)據(jù)稀疏 映射函數(shù) 用戶學(xué)習(xí) 清空 映射 分段 緩解 聯(lián)合 | ||
本發(fā)明屬于電子商務(wù)信息處理技術(shù)領(lǐng)域,公開了一種具有多個輔助域的跨域推薦數(shù)據(jù)處理方法、跨域推薦數(shù)據(jù)處理系統(tǒng);獲取輔助域的評分矩陣,計算用戶的評分可靠性,等比例分段映射閾值,將輔助域中評分?jǐn)?shù)量低于閾值的評分清空;使用K?means聚類算法得到所有域的聚類級評分矩陣,進(jìn)行矩陣分解;同時分解目標(biāo)域評分矩陣,為冷啟動用戶學(xué)習(xí)特征映射函數(shù);使用平均絕對誤差來評估預(yù)測到的評分矩陣。與現(xiàn)有技術(shù)相比,本發(fā)明在數(shù)據(jù)處理的過程當(dāng)中使用K?means聚類算法得到聯(lián)合所有域的聚類級的用戶?項目評分矩陣,降低了冷啟動用戶的數(shù)據(jù)稀疏性;緩解了傳統(tǒng)單個輔助域矩陣分解模型預(yù)測準(zhǔn)確度不佳而造成推薦效果不理想的問題,提升推薦系統(tǒng)的推薦效果,而且更具有通用性。
技術(shù)領(lǐng)域
本發(fā)明屬于電子商務(wù)信息處理技術(shù)領(lǐng)域,尤其涉及一種具有多個輔助域的跨域推薦數(shù)據(jù)處理方法、跨域推薦數(shù)據(jù)處理系統(tǒng)。
背景技術(shù)
目前,業(yè)內(nèi)常用的現(xiàn)有技術(shù)是這樣的:隨著互聯(lián)網(wǎng)技術(shù)和Web技術(shù)的高速發(fā)展,電子商務(wù)成為一種新的商務(wù)活動形式,越來越多的消費者愿意通過網(wǎng)絡(luò)購買自己需要的商品。通過線上購物的方式,消費者可以瀏覽各種各樣的商品;相對于傳統(tǒng)的線下購物方式,線上購物使消費者擁有更多的選擇權(quán)。但是另一方面,網(wǎng)絡(luò)上各類信息更新速度之快,又使消費者很容易迷失在種類繁多的“產(chǎn)品海洋”中。在給消費者帶來諸多便利的同時,“信息過載”問題隨之而來,互聯(lián)網(wǎng)上的消費者很難找到自己需要的信息。為了幫助消費者找到他們真正需要的商品,提高消費者的購物體驗,推薦系統(tǒng)成為電子商務(wù)應(yīng)用中不可或缺的一部分。推薦系統(tǒng)作為一種有效的消息過濾手段,是當(dāng)前解決信息過載問題及實現(xiàn)個性化信息服務(wù)的有效方法之一。一般來說,內(nèi)容過濾和協(xié)同過濾是推薦系統(tǒng)中最基本的兩種推薦策略。其中內(nèi)容過濾往往需要搜集一些外部信息,比如產(chǎn)品的特性、用戶的特征等等,而這些信息有時并不容易甚至無法獲得。協(xié)同過濾僅僅依賴于用戶的歷史行為——如瀏覽歷史、交易記錄、歷史評分等,不僅不需要專業(yè)的領(lǐng)域知識和特征文本信息,還能夠?qū)?shù)據(jù)潛在的特征進(jìn)行建模,實現(xiàn)比內(nèi)容過濾更準(zhǔn)確的推薦,這也使得協(xié)同過濾成為一種廣泛使用的推薦技術(shù)。
近年來,為了應(yīng)對普遍存在的數(shù)據(jù)稀疏性問題,跨領(lǐng)域推薦技術(shù)被提出,其目的是使用多個領(lǐng)域中更豐富的數(shù)據(jù),通過遷移學(xué)習(xí)的思想,在不同領(lǐng)域之間有效地進(jìn)行知識的遷移,獲得比單一領(lǐng)域推薦更好的推薦效果。但是現(xiàn)階段的大多數(shù)跨領(lǐng)域推薦模型往往只集中于解決單一領(lǐng)域中的數(shù)據(jù)稀疏性問題,對冷啟動用戶問題卻缺乏廣泛而深入的研究。
現(xiàn)有技術(shù)提出了一種基于近鄰的跨域潛在特征映射方法。該方法從三個不同的角度觀察用戶之間評分行為的相似度,并給出了三個相似度度量的計算方法;最后將三個相似度度量值的加權(quán)平均作為用戶之間評分行為相似度的值。該文方法存在的不足是,該方法針對的是兩個域中存在錨用戶情況下的目標(biāo)域冷啟動用戶問題,不能對多個輔助域的情況進(jìn)行跨域推薦。因此,希望能夠提出一種通用性更強的跨域推薦模型,來實現(xiàn)多個輔助域情況下目標(biāo)域冷啟動用戶問題。
綜上所述,現(xiàn)有技術(shù)存在的問題是:現(xiàn)有技術(shù)針對的是兩個域中存在錨用戶情況下的目標(biāo)域冷啟動用戶問題,不能對多個輔助域的情況進(jìn)行跨域推薦。
解決上述技術(shù)問題的難度和意義:針對目標(biāo)域冷啟動用戶的跨領(lǐng)域協(xié)同過濾問題,其實是極富挑戰(zhàn)性的。第一,在不同的產(chǎn)品域中,數(shù)據(jù)稀疏性問題是普遍存在的。如何利用稀疏的評分?jǐn)?shù)據(jù)完成對用戶和產(chǎn)品的有效建模,一直都是困擾協(xié)同過濾模型的難題。第二,用戶在不同的領(lǐng)域中具有不同的偏好和行為特征,對于不同領(lǐng)域中的評分?jǐn)?shù)據(jù),不可以簡單地混合使用。因此,考慮領(lǐng)域因素的影響,計算具有領(lǐng)域特點的用戶特征,是保證準(zhǔn)確跨域推薦的重要前提。第三,雖然同一個用戶在不同領(lǐng)域中的偏好和特征是相關(guān)的,但同時它們也存在著很大的差異。因此在輔助域中應(yīng)該提取關(guān)于冷啟動用戶的哪些知識,如何將這些知識遷移至目標(biāo)域中的評分預(yù)測,這些都是亟待解決的問題。正是因為這樣,跨域推薦通過整合冷啟動用戶或產(chǎn)品在不同領(lǐng)域中的信息,可以減少數(shù)據(jù)的稀疏性,豐富其在目標(biāo)域中的知識,進(jìn)而緩解目標(biāo)域中的冷啟動問題。因此,研究跨域推薦具有深遠(yuǎn)的實踐意義。
發(fā)明內(nèi)容
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于西安電子科技大學(xué),未經(jīng)西安電子科技大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811402203.8/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
- 業(yè)務(wù)故障恢復(fù)方法
- 多級跨域訪問控制系統(tǒng)及控制方法
- 獲取跨域分離路徑的方法、路徑計算單元
- 一種基于SAML的跨域單點登錄系統(tǒng)及登錄方法
- 數(shù)據(jù)跨域請求方法、設(shè)備及系統(tǒng)
- 一種基于IMS架構(gòu)的跨域即時通訊方法及其系統(tǒng)
- 一種跨域傳輸業(yè)務(wù)多級多維聯(lián)動管控系統(tǒng)
- 一種跨域資源動態(tài)編排方法及跨域互聯(lián)系統(tǒng)
- 一種基于交換授權(quán)文件的跨域文件交換引接設(shè)備及方法
- 支持分控的視聯(lián)網(wǎng)跨域通信方法、裝置、設(shè)備及介質(zhì)
- 數(shù)據(jù)處理設(shè)備,數(shù)據(jù)處理方法,和數(shù)據(jù)處理程序
- 數(shù)據(jù)處理電路、數(shù)據(jù)處理裝置、數(shù)據(jù)處理方法、數(shù)據(jù)處理控制方法
- 數(shù)據(jù)處理設(shè)備、數(shù)據(jù)處理方法和數(shù)據(jù)處理程序
- 數(shù)據(jù)處理裝置、數(shù)據(jù)處理方法及數(shù)據(jù)處理程序
- 數(shù)據(jù)處理裝置、數(shù)據(jù)處理方法及計算機可讀取的記錄介質(zhì)
- 數(shù)據(jù)處理裝置、數(shù)據(jù)處理方法和數(shù)據(jù)處理程序
- 數(shù)據(jù)處理裝置、數(shù)據(jù)處理方法和數(shù)據(jù)處理程序
- 數(shù)據(jù)處理裝置、數(shù)據(jù)處理方法以及數(shù)據(jù)處理程序
- 數(shù)據(jù)處理裝置、數(shù)據(jù)處理方法以及數(shù)據(jù)處理程序
- 數(shù)據(jù)處理裝置、數(shù)據(jù)處理方法和數(shù)據(jù)處理程序
- 一種基于矩陣分解的網(wǎng)絡(luò)交換調(diào)度方法
- 基于矩陣隱私保護(hù)的矩陣QR分解的方法
- 基于增量式凸局部非負(fù)矩陣分解的數(shù)據(jù)處理方法
- 一種基于改進(jìn)的按位替換法求矩陣三角分解的模塊
- 一種基于聯(lián)合天氣信息矩陣分解的電量數(shù)據(jù)恢復(fù)方法
- 基于NMF的圖像分解方法
- 一種計算機可讀存儲介質(zhì)、數(shù)據(jù)處理方法、裝置及服務(wù)器
- 一種基于機器學(xué)習(xí)訓(xùn)練模型獲取矩陣分解時間的方法
- Cholesky分解算法運算級流水線硬件加速方法
- 基于矩陣分解的非2<base:Sup>n





