[發明專利]基于多樣性的電商推薦算法在審
| 申請號: | 202210922516.6 | 申請日: | 2022-08-02 |
| 公開(公告)號: | CN115115435A | 公開(公告)日: | 2022-09-27 |
| 發明(設計)人: | 王冠;武久國 | 申請(專利權)人: | 北京工業大學 |
| 主分類號: | G06Q30/06 | 分類號: | G06Q30/06;G06K9/62 |
| 代理公司: | 湖北唯邁知識產權代理事務所(普通合伙) 42314 | 代理人: | 任偉民 |
| 地址: | 100124 *** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 多樣性 推薦 算法 | ||
1.基于多樣性的電商推薦算法,其特征在于,包括:
①、為了解決在電商推薦場景下,優化推薦算法,提高推薦多樣性,并且解決電商推薦算法推薦長尾現象,推薦算法模型的評價準則為:
(1)、準確率和召回率:準確率是針對預測結果而言的,它表示的是預測為正的樣本中有多少是真正的正樣本;而召回率是針對原來的樣本而言的,它表示的是樣本中的正例有多少被預測正確了;如下式:
式中,INu為用戶u推薦的物品列表,Tu表示與用戶u實際有過交互行為的物品列表;
(2)、覆蓋率:指的是推薦系統中推薦的物品數占總物品集合的比例,如下式:
其中,|I|表示總物品數,覆蓋率較高的推薦算法可以將物品空間中的大量物品推薦給系統的用戶,這樣的推薦算法才具有良好的長尾商品的挖掘能力,所以好的推薦算法需要在保持較高準確率和召回率的同時,提高其覆蓋率;
(3)、平均流行度:為了更好的解決推薦算法推薦長尾物品的能力,使用平均流行度衡量推薦系統推薦長尾商品的能力;平均流行度越高,說明推薦算法傾向于推薦流行物品;所以為了提高推薦算法推薦長尾商品的能力,平均流行度需要盡可能的低,如下式:
其中,INu為用戶u推薦的物品列表,表示與物品i有過交互的用戶數占總用戶數的比例;
②、上述基于長尾現象推薦算法的模型,傳統的基于協同過濾的推薦算法均會受到不同程度的長尾效應的影響,為此,對傳統的基于協同過濾的推薦算法進行改進,使長尾商品得到有效的推薦,具體為:
(1)、采用某網購平臺100萬條商品評分數據集進行實驗,將商品轉換成數據點的形式,采用K-Means聚類算法將商品進行分類,具體流程如下:
(11)、隨機選取K個中心點,生成對應的k個簇;
(12)、遍歷所有的數據點,依據“距離”將每一個數據點劃分到最近的中心點所在的簇;
(13)、計算每個簇所有的數據點的平均值,并作為該簇新的中心;
(14)、重復2-3步,直到這k個簇的中心點不再變化,或者達到規定的迭代次數;
將K-Means算法的第(12)步中計算距離改成計算每一個數據點劃分到最近的中心點所在的簇的相似度;相似度采用(2)中的修正的余弦相似度公式;
(2)、在基于用戶的協同過濾算法計算相似度時采用修正的余弦相似度公式(在計算用戶相似度時對用戶u和用戶v共同興趣列表中的熱門物品進行懲罰),公式如下:
其中,|H(i)|表示與物品i有過歷史交互記錄的用戶集合,|H(i)|越大說明與物品i有過交互行為的用戶數越多,也就是物品i越熱門,熱門物品在計算用戶相似度時所占的比例就越小。
2.根據權利要求1所述的基于多樣性的電商推薦算法,其特征在于:所述的采用某網購平臺100萬商品評述數據集進行實驗,數據的格式為產品編號、產品ID、評分、用戶ID。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京工業大學,未經北京工業大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202210922516.6/1.html,轉載請聲明來源鉆瓜專利網。





