[發(fā)明專利]一種基于用戶聚類的推薦方法有效
| 申請?zhí)枺?/td> | 201410565721.7 | 申請日: | 2014-10-22 |
| 公開(公告)號: | CN104268290B | 公開(公告)日: | 2017-08-08 |
| 發(fā)明(設(shè)計(jì))人: | 李鵬;王婭丹;金瑜;劉璟;劉欣 | 申請(專利權(quán))人: | 武漢科技大學(xué) |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 武漢科皓知識產(chǎn)權(quán)代理事務(wù)所(特殊普通合伙)42222 | 代理人: | 嚴(yán)彥 |
| 地址: | 430081 *** | 國省代碼: | 湖北;42 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 用戶 推薦 方法 | ||
1.一種基于用戶聚類的推薦方法,其特征在于,包括以下步驟:
Step1,輸入用戶集合U={u1,u2…uα}和主題標(biāo)簽集合C={s1,s2…sβ},α表示用戶個數(shù),β表示主題標(biāo)簽集合C中主題標(biāo)簽個數(shù);初始化當(dāng)前處理用戶序號i取值為1,轉(zhuǎn)到Step2;
Step2,初始化當(dāng)前處理標(biāo)簽序號j取值為1,轉(zhuǎn)到Step3;
Step3,如果用戶ui關(guān)注了主題標(biāo)簽sj,轉(zhuǎn)到Step4;否則令用戶對第j個主題標(biāo)簽感興趣的程度dj=0,轉(zhuǎn)到Step9;
Step4,根據(jù)用戶ui對主題標(biāo)簽sj的瀏覽次數(shù)n,確定出用戶ui對主題標(biāo)簽sj的總瀏覽頻率f=n,轉(zhuǎn)到Step5;
Step5,確定用戶ui對主題標(biāo)簽sj的第k次瀏覽時間tj,k以及總瀏覽時間T,k的取值為1,2,…n,轉(zhuǎn)到Step6;
Step6,確定用戶ui對主題標(biāo)簽sj的有效瀏覽頻率ef,轉(zhuǎn)到Step7;
確定方式為,若tmin≤tj,k≤tmax,tmin和tmax為用戶ui對標(biāo)簽的最小瀏覽時間和最大瀏覽時間的預(yù)設(shè)閾值,則用戶ui對第j個主題標(biāo)簽的第k次瀏覽是有效的,則用戶ui對第j個主題標(biāo)簽的n次瀏覽過程中,所有有效瀏覽的次數(shù)之和為用戶ui對第j個主題標(biāo)簽的有效瀏覽頻率;
Step7,求ef次有效瀏覽的瀏覽時間之和,計(jì)算出用戶ui對主題標(biāo)簽sj的有效瀏覽時間et,轉(zhuǎn)到Step8;
Step8,根據(jù)下式,計(jì)算出用戶ui對主題標(biāo)簽sj興趣度dj,轉(zhuǎn)到Step9;
其中,參數(shù)f1為用戶對所有主題標(biāo)簽的瀏覽頻率之和;ps為預(yù)設(shè)的系統(tǒng)參數(shù)興趣時間系數(shù),表示用戶對第j個主題標(biāo)簽的平均瀏覽時間,表示用戶對第j個主題標(biāo)簽的平均有效瀏覽時間;
Step9,設(shè)用戶ui在主題標(biāo)簽集合C中未瀏覽過的標(biāo)簽集合用cb表示,瀏覽過的標(biāo)簽集合用ca表示,根據(jù)下式,計(jì)算Vi,j,Vi,j表示用戶ui對主題標(biāo)簽sj的興趣度值,用戶ui的興趣向量為vi(Vi,1,Vi,2,…Vi,β);令j=j(luò)+1,如果j小于等于β則轉(zhuǎn)到Step3,否則轉(zhuǎn)到Step10;
Step10,令i=i+1,如果i小于等于α,轉(zhuǎn)到Step2,否則令i=1,初始化核心用戶數(shù)目γ取值為0,轉(zhuǎn)到Step11;
Step11,根據(jù)用戶ui的興趣向量vi(Vi,1,Vi,2,…Vi,β)中非零元素所占比例得到興趣密度值density(ui),如果興趣密度值density(ui)>λ,標(biāo)記ui為核心用戶,轉(zhuǎn)到Step12;否則轉(zhuǎn)到Step13;其中,λ為預(yù)設(shè)的密度閾值;
Step12,令γ=γ+1,轉(zhuǎn)到Step13;
Step13,令i=i+1,如果i小于等于α,轉(zhuǎn)到Step11;否則轉(zhuǎn)到Step14;
Step14,當(dāng)前得到γ個核心用戶,開始用K-means算法對全部用戶進(jìn)行聚類,本步驟以γ個核心用戶為初始的聚類中心,初始定義變量newJ=0,oldJ=-1,轉(zhuǎn)到Step15;
Step15,計(jì)算fabs(newJ-oldJ),fabs函數(shù)表示計(jì)算絕對值,如果fabs(newJ-oldJ)大于等于絕對值的相應(yīng)預(yù)設(shè)閾值,轉(zhuǎn)到Step16,否則轉(zhuǎn)到Step19;
Step16,對用戶集合U={u1,u2…uα}中作為聚類中心的用戶以外的各剩余用戶,分別計(jì)算剩余用戶與每個作為聚類中心的用戶之間的歐式距離,并分配到距離最近的聚類中心相應(yīng)聚類中,轉(zhuǎn)到Step17;
Step17,計(jì)算每個用戶聚類Rh中所有用戶興趣向量的平均值,作為用戶聚類Rh新的聚類中心Zh,轉(zhuǎn)到Step18;
Step18,令oldJ=newJ,根據(jù)準(zhǔn)則函數(shù)計(jì)算新的準(zhǔn)則函數(shù)值賦值給newJ,轉(zhuǎn)到Step15;
Step19,當(dāng)前得到γ個用戶聚類R1,R2…Rγ,轉(zhuǎn)到Step20;
Step20,初始化當(dāng)前處理類別序號h取值為1,轉(zhuǎn)到Step21;
Step21,根據(jù)下式計(jì)算該類別的類興趣向量Rvh=(RVh1,RVh2,...,RVhβ),轉(zhuǎn)到Step22;
其中,|Rh|表示用戶聚類Rh中的用戶個數(shù),表示用戶聚類Rh中的任一用戶,用w表示聚類Rh中用戶個數(shù),取值為1,2......w,表示用戶聚類Rh中用戶對第j個主題標(biāo)簽的興趣度,RVhj表示用戶聚類Rh對第j個主題標(biāo)簽的興趣度,j取值為1,2......β;
Step22,令h=h+1,如果h小于等于γ,轉(zhuǎn)到Step21,否則轉(zhuǎn)到Step23;
Step23,此時得到γ個類別的類興趣向量,Rv1,Rv2…Rvγ,令h=1,轉(zhuǎn)到Step24;
Step24,為用戶聚類Rh中的每個用戶分別推薦主題標(biāo)簽,設(shè)用戶聚類Rh中的用戶為用戶集合U={u1,u2…uα}中的用戶ui,對于用戶ui的興趣向量vi(Vi,1,Vi,2,…Vi,β),把它與用戶聚類Rh的類興趣向量Rvh=(RVh1,RVh2,...,RVhβ)中各興趣值RVhj進(jìn)行比較,如果Vi,j大于等于RVhj,則把主題標(biāo)簽sj推薦給用戶,轉(zhuǎn)到Step25;
Step25,令h=h+1,如果h小于等于γ,轉(zhuǎn)到Step24,否則轉(zhuǎn)到Step26;
Step26,對用戶集合U={u1,u2…uα}中每個用戶的自動推薦均已完成,結(jié)束。
2.根據(jù)權(quán)利要求1所述基于用戶聚類的推薦方法,其特征在于:Step18中,準(zhǔn)則函數(shù)的計(jì)算公式如下,
其中,w代表用戶聚類Rh中用戶個數(shù),表示兩個特征向量之間的偏差的平方,為用戶聚類Rh中的用戶的興趣向量,Zh為相應(yīng)類別的聚類中心。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于武漢科技大學(xué),未經(jīng)武漢科技大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201410565721.7/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06F 電數(shù)字?jǐn)?shù)據(jù)處理
G06F17-00 特別適用于特定功能的數(shù)字計(jì)算設(shè)備或數(shù)據(jù)處理設(shè)備或數(shù)據(jù)處理方法
G06F17-10 .復(fù)雜數(shù)學(xué)運(yùn)算的
G06F17-20 .處理自然語言數(shù)據(jù)的
G06F17-30 .信息檢索;及其數(shù)據(jù)庫結(jié)構(gòu)
G06F17-40 .數(shù)據(jù)的獲取和記錄
G06F17-50 .計(jì)算機(jī)輔助設(shè)計(jì)





