[發明專利]基于協同過濾算法和聚類算法的卷煙消費研判方法有效
| 申請號: | 201710121176.6 | 申請日: | 2017-03-02 |
| 公開(公告)號: | CN107103488B | 公開(公告)日: | 2021-05-18 |
| 發明(設計)人: | 茅斯佳;蘇建康;李劍;強韶軍;李霓彬 | 申請(專利權)人: | 江蘇省煙草公司常州市公司 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62;G06Q30/02 |
| 代理公司: | 常州品益專利代理事務所(普通合伙) 32401 | 代理人: | 張岳 |
| 地址: | 213000 江*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 協同 過濾 算法 卷煙 消費 研判 方法 | ||
1.一種基于協同過濾算法和聚類算法的卷煙消費研判方法,其特征在于包括以下步驟:
1)樣本采集;通過樣本消費者的瀏覽記錄、點贊情況、查詢頻繁度、購買記錄以及注冊時填報的卷煙偏好,獲得樣本消費者對卷煙各品規的偏好度;
2)特征采集:選取多個用戶特征信息的特征值構建消費者特征向量,得到消費者特征矩陣;選取多個商品特征信息的特征值構建卷煙特征向量,得到卷煙特征矩陣;
3)聚類:運用K-means++算法分別對樣本消費者和卷煙進行聚類,并計算各類類中心的偏好度;
步驟包括:
A、先從輸入的數據點集合中隨機選擇一個點作為第一聚類中心;
B、對于數據集中的每一個點,計算它與最近聚類中心的距離D(x);
C、選擇另一個新的數據點作為新的聚類中心;原則是:D(x)較大的點,被選取作為聚類中心的概率較大;
D、重復步驟B和步驟C,直到k個中心被選擇出來;
E、利用這k個初始的聚類中心來運行標準的k-means算法;
4)相似度計算:根據所聚消費者類別,運用余弦距離計算公式,計算目標消費者與所屬類中心的距離,以距離大小獲得目標消費者與所屬類中心的相似度大小;根據所聚卷煙類別,運用余弦距離計算公式,計算目標卷煙品規與所屬類中心的距離,以距離大小獲得目標卷煙品規與所屬類中心的相似度大小;
5)偏好度計算:根據協同過濾中user-based思想,結合計算所得相似度,計算目標消費者對目標品規user-based偏好度;根據協同過濾中item-based思想,結合計算所得相似度,計算目標消費者對目標品規item-based偏好度;
將根據user-based和item-based計算的偏好度求平均,得到某消費者i對某品規卷煙j的偏好程度rij,據此,rij是消費者i對品規卷煙j需求的研判值。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于江蘇省煙草公司常州市公司,未經江蘇省煙草公司常州市公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710121176.6/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種基于大數據的廣告推送方法
- 下一篇:一種訂單信息確定方法和裝置





