[發明專利]一種基于聚類的個性化導購系統在審
| 申請號: | 202010426595.2 | 申請日: | 2020-05-19 |
| 公開(公告)號: | CN111612583A | 公開(公告)日: | 2020-09-01 |
| 發明(設計)人: | 馬漢達;戴季國 | 申請(專利權)人: | 江蘇大學 |
| 主分類號: | G06Q30/06 | 分類號: | G06Q30/06;G06K9/62;G06F16/9535 |
| 代理公司: | 南京蘇高專利商標事務所(普通合伙) 32204 | 代理人: | 柏尚春 |
| 地址: | 212013 *** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 個性化 導購 系統 | ||
1.一種基于聚類的個性化導購系統,其特征在于,所述導購系統包括數據收集模塊、行為量化模塊、商品類別篩選模塊、矩陣填充模塊、用戶聚類模塊和生成推薦模塊;所述數據收集模塊用于收集商品屬性和用戶行為數據;所述行為量化模塊用于量化用戶的操作行為;所述商品類別篩選模塊用于對所有商品進行類別的篩選;所述矩陣填充模塊利用樸素貝葉斯算法進行矩陣填充,初步預測出未操作商品的評分;所述用戶聚類模塊利用基于密度劃分準則的二分K均值算法,為用戶進行聚類;所述生成推薦模塊,用于將推薦的結果呈現給用戶。
2.如權利要求1所述的基于聚類的個性化導購系統,其特征在于,所述數據收集模塊中商品屬性包括商品名稱、分類、品牌、價格、產地,用戶行為數據包括點贊、購買和收藏,所述用戶行為數據通過web日志挖掘、Javascript頁面標記進行收集。
3.如權利要求1所述的基于聚類的個性化導購系統,其特征在于,所述行為量化模塊通過數據收集模塊得到用戶行為數據,love、purchase、collect分別表示點贊、購買、收藏;并將這些數據量化為用戶評分,用戶評分等級定義為scoreSet={scorei,j},scorei,j=1,2,3,4,5;
利用公式1計算用戶對商品的喜好程度:
scorei,j=a×lovei,j+b×purchasei,j+c×collecti,j (1)
其中,i和j分別代表用戶的ID和商品的ID,lovei,j,purchasei,j,collecti,j的取值為0或1,a,b,c是一組常數,分別代表用戶各種行為的權重,購買的權重大于收藏,收藏的權重大于點贊;
利用公式2計算用戶評分值:
表示新的用戶評分值;表示歷史評分值的最大值;表示更新之后的評分尺度的最大值;round函數表示就近取整,將評分數據映射到1~5分之內。
4.如權利要求1所述的基于聚類的個性化導購系統,其特征在于,所述矩陣填充模塊利用樸素貝葉斯算法進行矩陣填充的方法,用商品屬性作為樸素貝葉斯的特征,將多級評分預測轉化成多元分類,具體方法如下:
假設現有m個類別,分別為C1、C2、...、Cm,另有多個對象,每個對象有n項特征,分別為F1,F2,...,Fn,樸素貝葉斯分類算法需要計算出目標對象屬于各個分類的概率,將目標對象歸入概率最大的分類當中,具體計算方法如公式3所示:
由于P(F1F2...Fn)對于所有的類別取值都是相同的,因此公式3右半部分可以直接簡化成:
P(F1F2...Fn|C)P(C)
樸素貝葉斯分類基于這樣一個假設,即假設所有特征都彼此獨立,所以上述式子可以進一步轉化成:
P(F1|C)P(F2|C)...P(Fn|C)P(C)
P(C)和每一個P(Fn|C)都可以從訓練數據集中統計獲取,通過上述式子算出各個類別C的對應概率,將目標對象歸入概率最大的分類中;
將數據收集模塊收集的商品屬性作為貝葉斯分類中的特征,用戶評分等級取1到5,將5個級別的評分作為5個分類,將多級評分預測轉化成5元分類模型,通過5元分類模型,分別計算出用戶給商品打出不同分數的概率,概率最大的類對應的分數,就是預測出的評分,利用貝葉斯分類算法得到初步的預測評分之后,將該評分填入稀疏的評分矩陣。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于江蘇大學,未經江蘇大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010426595.2/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種兒童鼻中隔偏曲矯正器
- 下一篇:一種污水雜質檢測設備及檢測方法





