[發(fā)明專利]基于物品分類和用戶分類的協(xié)同過濾推薦方法有效
| 申請?zhí)枺?/td> | 201210030236.0 | 申請日: | 2012-02-10 |
| 公開(公告)號(hào): | CN102609523B | 公開(公告)日: | 2018-03-06 |
| 發(fā)明(設(shè)計(jì))人: | 施榮杰;王守軍 | 申請(專利權(quán))人: | 上海視暢信息科技有限公司 |
| 主分類號(hào): | G06F17/30 | 分類號(hào): | G06F17/30 |
| 代理公司: | 上海愉騰專利代理事務(wù)所(普通合伙)31306 | 代理人: | 唐海波 |
| 地址: | 201699 上海市松江區(qū)*** | 國省代碼: | 上海;31 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 基于 物品 分類 用戶 協(xié)同 過濾 推薦 方法 | ||
1.一種基于物品分類和用戶分類的協(xié)同過濾推薦方法,其特征在于采用如下步驟:
A、物品的聚類與分類步驟:
首先,采用PCA分析方法鑒別物品的主要特征,即對整個(gè)物品集合所成的特征空間進(jìn)行主軸定位,并得到PCA空間映射矩陣;
其次,采用KMEANS算法完成數(shù)據(jù)的聚類,即對每個(gè)物品都定義一個(gè)特征向量,該特征向量涵蓋了物品的主要特征標(biāo)簽,通過余弦距離度量公式計(jì)算每兩個(gè)物品之間的相似度,其公式如下:
其中,V1,V2表示物品的特征向量:V1=(v11,v12,...,v1n),V2=(v21,v22,...,v2n);根據(jù)應(yīng)用的不同,給每個(gè)特征項(xiàng)賦予一定的權(quán)重以表示該特征的重要程度,即:V1=(v11,w11;v12,w12;...;v1n,w1n),V2=(v21,w21;v22,w22;...;v2n,w2n);
最后,在完成對物品的聚類后,記錄每個(gè)類的類中心,當(dāng)有新的物品加入時(shí)即可在PCA空間進(jìn)行距離計(jì)算,把新物品分類到離它最近的類中心所代表的那個(gè)類別;
B、用戶的聚類與分類步驟:當(dāng)系統(tǒng)積累的用戶數(shù)據(jù)量足夠時(shí),即可根據(jù)用戶的類別消費(fèi)特征向量來為用戶進(jìn)行聚類和分類,其過程和上述物品的聚類與分類步驟是一樣的;
C、物品聚類與用戶聚類的融合步驟:每個(gè)物品有了分類信息后,用戶對物品的消費(fèi)記錄就可以轉(zhuǎn)化為對類別的消費(fèi)記錄,從而使得用戶消費(fèi)特征的維度與類別的總數(shù)一致;
D、排序推薦步驟:按照類內(nèi)按相似度排序來進(jìn)行推薦,或者按照用戶的消費(fèi)歷史根據(jù)類別排序后再按比例進(jìn)行相關(guān)類內(nèi)物品排序來進(jìn)行推薦,或者按照用戶的類別來進(jìn)行推薦,把同類其他用戶的消費(fèi)物品推薦給該用戶;
在步驟A中,所述的PCA分析方法為主成分分析算法,即Principal ComponentAnalysis,其為降維統(tǒng)計(jì)方法,通過正交變換,將分量相關(guān)的原表征向量轉(zhuǎn)化成分量不相關(guān)的新表征向量,其方法如下:
定義物品的加權(quán)特征向量為V=(v1,w1;v2,w2;...;vK,wK)T,其具備K個(gè)維度;現(xiàn)在取出n個(gè)物品:Vi=(vi1,wi1;vi2,wi2;...;viK,wiK)T,其中1≤i≤n;
定義矩陣:
計(jì)算物品在每個(gè)維度即屬性上的均值:
計(jì)算每個(gè)物品離開均值的距離,該距離相當(dāng)于坐標(biāo)軸原點(diǎn)平移:這里的I=(1,...,1)是一個(gè)長度為n列的行向量;
計(jì)算這n個(gè)物品的協(xié)方差矩陣:
計(jì)算矩陣C的特征向量和特征值:A-1CA=D,其中,D表示C的特征值對角陣;
A表示C的特征向量矩陣;
對D和A按降序排列其中的特征值和特征向量,特征值的大小表征了主軸軸向上的物品屬性的分離度,選取其中的前L個(gè)特征值和對應(yīng)的特征向量:0≤L≤K,滿足:
對應(yīng)的,選取A的前L個(gè)特征向量:B=[Ai1,Ai2,...,AiL],其中,Aik(1≤k≤L)表示特征向量矩陣的某一列;
對于任何一個(gè)新到的樣本,通過下面的公式計(jì)算其在給定PCA空間中的新坐標(biāo),即新特征向量:Vn+1=BT(vn+1,1,wn+1,1;vn+1,2,wn+1,2;...;vn+1,K,wn+1,K)T。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于上海視暢信息科技有限公司,未經(jīng)上海視暢信息科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201210030236.0/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 上一篇:一種免燙整理劑及其制備方法
- 下一篇:裁切裝置
- 同類專利
- 專利分類
G06F 電數(shù)字?jǐn)?shù)據(jù)處理
G06F17-00 特別適用于特定功能的數(shù)字計(jì)算設(shè)備或數(shù)據(jù)處理設(shè)備或數(shù)據(jù)處理方法
G06F17-10 .復(fù)雜數(shù)學(xué)運(yùn)算的
G06F17-20 .處理自然語言數(shù)據(jù)的
G06F17-30 .信息檢索;及其數(shù)據(jù)庫結(jié)構(gòu)
G06F17-40 .數(shù)據(jù)的獲取和記錄
G06F17-50 .計(jì)算機(jī)輔助設(shè)計(jì)





