[發(fā)明專利]獲取推薦對(duì)象的方法及裝置有效
| 申請(qǐng)?zhí)枺?/td> | 201510342894.7 | 申請(qǐng)日: | 2015-06-18 |
| 公開(公告)號(hào): | CN104933143B | 公開(公告)日: | 2019-06-04 |
| 發(fā)明(設(shè)計(jì))人: | 楊德坤;鄭宸;賀煒;王彥明 | 申請(qǐng)(專利權(quán))人: | 北京京東尚科信息技術(shù)有限公司;北京京東世紀(jì)貿(mào)易有限公司 |
| 主分類號(hào): | G06F16/9535 | 分類號(hào): | G06F16/9535 |
| 代理公司: | 中原信達(dá)知識(shí)產(chǎn)權(quán)代理有限責(zé)任公司 11219 | 代理人: | 姜?jiǎng)?陸錦華 |
| 地址: | 100080 北京市海淀區(qū)杏石口路6*** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 獲取 推薦 對(duì)象 方法 裝置 | ||
本發(fā)明提供一種獲取推薦對(duì)象的方法及裝置,具有搜索速度快,適用范圍廣等優(yōu)點(diǎn)。該方法包括:構(gòu)建原始用戶矩陣和原始對(duì)象矩陣,其中,原始用戶矩陣中的每一行為原始用戶向量,每個(gè)原始用戶向量表示一個(gè)用戶的多重屬性特征,原始對(duì)象矩陣中的每一行為原始對(duì)象向量,每個(gè)原始對(duì)象向量表示一個(gè)對(duì)象的多重屬性特征;對(duì)原始用戶矩陣和原始對(duì)象矩陣進(jìn)行保序變換,得到新用戶矩陣和新對(duì)象矩陣;對(duì)新對(duì)象矩陣中的新對(duì)象向量構(gòu)建對(duì)象高維索引結(jié)構(gòu);對(duì)新用戶矩陣中的各個(gè)新用戶向量在對(duì)象高維索引結(jié)構(gòu)中進(jìn)行最近鄰搜索,得到新用戶向量對(duì)應(yīng)的最近鄰新對(duì)象向量;根據(jù)各個(gè)新用戶向量及其對(duì)應(yīng)的最近鄰新對(duì)象向量,輸出用戶與推薦對(duì)象的映射。
技術(shù)領(lǐng)域
本發(fā)明涉及計(jì)算機(jī)技術(shù)領(lǐng)域,尤其涉及一種獲取推薦對(duì)象的方法及裝置。
背景技術(shù)
隨著互聯(lián)網(wǎng)技術(shù)的發(fā)展,人們進(jìn)入了信息過載的時(shí)代。在用戶訪問網(wǎng)站的過程中,大量的新聞、商品、視頻、音樂等等對(duì)象呈現(xiàn)在了用戶面前。怎樣篩選出用戶真正感興趣的內(nèi)容對(duì)提高網(wǎng)站的訪問量及收益有著非常重要的意義。推薦系統(tǒng)相關(guān)的技術(shù)在這樣的背景下得到了越來越廣泛的使用。
近幾年來矩陣分解算法成為了推薦系統(tǒng)領(lǐng)域研究的主流,研究表明在個(gè)性化推薦中使用矩陣分解技術(shù)可以得到比傳統(tǒng)基于鄰域的協(xié)同過濾更好的結(jié)果。矩陣分解算法將用戶對(duì)對(duì)象的評(píng)分矩陣進(jìn)行分解,生成用戶矩陣U和對(duì)象矩陣V,這樣就將用戶和對(duì)象映射到了高維的潛語義空間。用戶矩陣及對(duì)象矩陣的每一行都是一個(gè)向量,表示相應(yīng)的用戶和對(duì)象。用戶向量與一個(gè)對(duì)象向量的內(nèi)積就是該用戶對(duì)對(duì)象的評(píng)分,內(nèi)積越大,評(píng)分越高,表示越是推薦。每個(gè)用戶的推薦對(duì)象可以取所有對(duì)象中K個(gè)內(nèi)積最大的對(duì)象向量對(duì)應(yīng)的對(duì)象作為推薦結(jié)果。
在實(shí)際應(yīng)用場景中,用戶和對(duì)象的數(shù)量往往龐大,相當(dāng)于多達(dá)千萬的用戶都需要在千萬級(jí)對(duì)象構(gòu)成的高維空間中搜索K個(gè)最大的內(nèi)積,該計(jì)算過程非常耗時(shí)。因此需要一種方案能夠快速地完成用戶和對(duì)象向量間最大內(nèi)積的Top K計(jì)算。
若采用最基本的線性搜索方法進(jìn)行最近鄰搜索,則時(shí)間復(fù)雜度較高,無法滿足海量數(shù)據(jù)下的需求。常用的解決方案是建立高維索引,利用高效的數(shù)據(jù)結(jié)構(gòu)和算法完成搜索。但是,由于內(nèi)積不滿足三角不等性且無法衡量向量間的相似性,導(dǎo)致常用的聚類、高維索引樹、局部感知哈希等建立高維索引的方案均無法直接適用于內(nèi)積空間的搜索。
發(fā)明內(nèi)容
有鑒于此,本發(fā)明提供一種獲取推薦對(duì)象的方法及裝置,具有搜索速度快,適用范圍廣等優(yōu)點(diǎn)。
為實(shí)現(xiàn)上述目的,根據(jù)本發(fā)明的一個(gè)方面,提供了一種獲取推薦對(duì)象的方法,包括:構(gòu)建原始用戶矩陣和原始對(duì)象矩陣,其中,所述原始用戶矩陣中的每一行為原始用戶向量,每個(gè)所述原始用戶向量表示一個(gè)用戶的多重屬性特征,所述原始對(duì)象矩陣中的每一行為原始對(duì)象向量,每個(gè)所述原始對(duì)象向量表示一個(gè)對(duì)象的多重屬性特征;對(duì)原始用戶矩陣和原始對(duì)象矩陣進(jìn)行保序變換,得到新用戶矩陣和新對(duì)象矩陣;對(duì)所述新對(duì)象矩陣中的新對(duì)象向量構(gòu)建對(duì)象高維索引結(jié)構(gòu);對(duì)所述新用戶矩陣中的各個(gè)新用戶向量在所述對(duì)象高維索引結(jié)構(gòu)中進(jìn)行最近鄰搜索,得到所述新用戶向量對(duì)應(yīng)的最近鄰新對(duì)象向量;根據(jù)各個(gè)所述新用戶向量及其對(duì)應(yīng)的所述最近鄰新對(duì)象向量,輸出用戶與推薦對(duì)象的映射。
可選地,所述對(duì)原始用戶矩陣和原始對(duì)象矩陣進(jìn)行保序變換,得到新用戶矩陣和新對(duì)象矩陣的步驟包括:對(duì)所述原始用戶矩陣的第i行向量xi添加數(shù)值0作為一個(gè)新的維度,得到新用戶向量從而得到所述新用戶矩陣;計(jì)算所述原始對(duì)象矩陣的第j行向量yj的2-范數(shù)以及該2-范數(shù)的最大值對(duì)所述yj添加作為一個(gè)新的維度,得到新對(duì)象向量從而得到所述新對(duì)象矩陣。
可選地,所述對(duì)所述新對(duì)象矩陣中的新對(duì)象向量構(gòu)建對(duì)象高維索引結(jié)構(gòu)的步驟包括:將所述新對(duì)象矩陣中的新對(duì)象向量聚類得到多個(gè)對(duì)象子類,每個(gè)對(duì)象子類具有一個(gè)對(duì)象聚類中心;為每個(gè)所述對(duì)象子類建立vp-tree樹結(jié)構(gòu)。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于北京京東尚科信息技術(shù)有限公司;北京京東世紀(jì)貿(mào)易有限公司,未經(jīng)北京京東尚科信息技術(shù)有限公司;北京京東世紀(jì)貿(mào)易有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201510342894.7/2.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 對(duì)象選擇裝置、對(duì)象選擇程序及對(duì)象選擇方法
- 對(duì)象顯示裝置、對(duì)象顯示系統(tǒng)以及對(duì)象顯示方法
- 對(duì)象顯示裝置、對(duì)象顯示方法和對(duì)象顯示程序
- 對(duì)象顯示裝置、對(duì)象顯示方法和對(duì)象顯示程序
- 對(duì)象顯示裝置、對(duì)象顯示方法和對(duì)象顯示程序
- 對(duì)象分析方法、對(duì)象分析設(shè)備及對(duì)象分析系統(tǒng)
- 對(duì)象索引方法、對(duì)象搜索方法及對(duì)象索引系統(tǒng)
- 對(duì)象分類方法和對(duì)象分類設(shè)備
- 對(duì)象庫中的對(duì)象簽名
- 對(duì)象追蹤方法、對(duì)象追蹤系統(tǒng)以及對(duì)象追蹤程序
- 一種數(shù)據(jù)庫讀寫分離的方法和裝置
- 一種手機(jī)動(dòng)漫人物及背景創(chuàng)作方法
- 一種通訊綜合測試終端的測試方法
- 一種服裝用人體測量基準(zhǔn)點(diǎn)的獲取方法
- 系統(tǒng)升級(jí)方法及裝置
- 用于虛擬和接口方法調(diào)用的裝置和方法
- 線程狀態(tài)監(jiān)控方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)
- 一種JAVA智能卡及其虛擬機(jī)組件優(yōu)化方法
- 檢測程序中方法耗時(shí)的方法、裝置及存儲(chǔ)介質(zhì)
- 函數(shù)的執(zhí)行方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)





