[發明專利]一種基于多維標簽與分類排序的推薦算法有效
| 申請號: | 201710402897.4 | 申請日: | 2017-06-01 |
| 公開(公告)號: | CN107341687B | 公開(公告)日: | 2021-06-08 |
| 發明(設計)人: | 董敏;劉皓熙;畢盛;湯雪;裴茂鋒 | 申請(專利權)人: | 華南理工大學 |
| 主分類號: | G06Q30/02 | 分類號: | G06Q30/02;G06Q30/06;G06K9/62 |
| 代理公司: | 廣州市華學知識產權代理有限公司 44245 | 代理人: | 馮炳輝 |
| 地址: | 510640 廣*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 多維 標簽 分類 排序 推薦 算法 | ||
1.一種基于多維標簽與分類排序的推薦算法,其特征在于,包括以下步驟:
1)對標簽數據進行組合構成多維標簽信息;
2)利用多維標簽信息計算多維標簽相似度,融入用戶協同過濾中并預測評分,得到推薦候選集1;利用多維標簽計算用戶相似度,包括以下步驟:
2.1)定義用戶集合{u1,u2,u3...uN},多維標簽集合為{t1,t2,t3...tK},其中N為用戶數量,K為多維標簽集合中標簽數量,用戶uj對物品的操作得到用戶uj對標簽tk的操作次數為njk,得到用戶uj的多維標簽操作向量Ij=(nj1,nj2,nj3...njK),其中j=1,2,3,…,N,則得到用戶-多維標簽操作矩陣IN×K為:
2.2)利用余弦相似度計算用戶u,v的多維標簽向量Iu,Iv的相似度,計算公式為:
2.3)使用線性加權的方法在用戶協同過濾中綜合考慮多維標簽信息的相似度,使用參數λ控制多維標簽相似度在協同過濾相似度中的權重,用戶相似度組成如下面式子所示;
sim(u,v)=(1-λ)sim1(u,v)+λsim2(u,v)
式中,sim1(u,v)為原始的相似度,sim2(u,v)為多維標簽相似度;
2.4)最后根據以下式子計算用戶u對物品i的評分得出多個高評分的推薦物品集合;
式中,為活躍用戶u的評分均值,rvi為用戶v對物品i的評分,為近鄰用戶v的評分均值,N(u)為用戶u的近鄰集合,sim(u,v)為用戶u與他的近鄰用戶v的相似度;
3)利用多維標簽信息作為隱式反饋信息輸入到矩陣分解中并預測評分,得到推薦候選集2,并結合推薦候選集1得到最終推薦候選集;將用戶-多維標簽操作矩陣IN×K轉化為二元反饋矩陣,輸入矩陣分解中,包括以下步驟:
3.1)將多維標簽信息轉化為二元反饋信息,將用戶-多維標簽矩陣IN×K通過下面式子轉化為二元的用戶-多維標簽反饋矩陣;
如果用戶操作過某個設定標簽,則值為1,反之值為0,在矩陣分解SVD中加入多維標簽反饋信息,式子如下:
式中,為預測評分,bu是用戶u的評分偏置,bi則是物品的偏置項,pu為用戶特征向量,qi為物品特征向量,N(u)為用戶u評過分的物品集合,T(u)為用戶u操作過的多維標簽集合,yj為物品j的反饋特征向量,za為標簽a的反饋特征向量;
3.2)加入矩陣分解中并使用隨機梯度下降求解得到用戶特征矩陣和物品特征矩陣,通過用戶特征矩陣和物品特征矩陣相乘得到評分矩陣,得出多個高評分的推薦物品集合;其中,加入多維標簽信息的矩陣分解更新公式如下:
bu←bu+γ·(eui-λ1·bu)
bi←bi+γ·(eui-λ1·bi)
pu←pu+γ·(eui·qi-λ2·pu)
式中,rui為用戶u對物品i的真實評分,為預測評分,eui為預測誤差,bu是用戶u的評分偏置,bi則是物品的偏置項,pu為用戶特征向量,qi為物品特征向量,N(u)為用戶u評過分的物品集合,T(u)為用戶u操作過的多維標簽集合,yj為物品j的反饋特征向量,za為標簽a的反饋特征向量,λ1、λ2為不同的正則化系數,γ是學習速率;
4)將得到的最終推薦候選集輸入到邏輯回歸分類模型中分類排序,根據輸出分值排序得到Top-N推薦列表。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于華南理工大學,未經華南理工大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710402897.4/1.html,轉載請聲明來源鉆瓜專利網。





