[發明專利]一種基于自適應多最小支持度的關聯規則推薦方法有效
| 申請號: | 201310688735.3 | 申請日: | 2013-12-17 |
| 公開(公告)號: | CN103700005A | 公開(公告)日: | 2014-04-02 |
| 發明(設計)人: | 馬廷淮;周金娟;朱節中;曹杰 | 申請(專利權)人: | 南京信息工程大學 |
| 主分類號: | G06Q30/02 | 分類號: | G06Q30/02 |
| 代理公司: | 南京經緯專利商標代理有限公司 32200 | 代理人: | 許方 |
| 地址: | 215101 江蘇省蘇州市吳中區木*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 自適應 最小 支持 關聯 規則 推薦 方法 | ||
1.一種基于自適應多最小支持度的關聯規則推薦方法,其特征在于,包括以下步驟:
步驟一、根據商品分類信息建立商品分類層次樹,并將數據集中商品按照商品分類層次樹進行歸類;
步驟二、在每類商品中設置商品最小支持度閾值:
其中,count(Xk)是t時段內商品Xk的交易量,total(Xi)為是t時段內類別Xi的交易量,且Xk∈Xi,price(Xk)為商品Xk的價格,pmax為類別Xi中商品的最高價格,brand(Xk)即為商品Xk的品牌權重,α為商品價格因素對計算商品最小支持度閾值的影響權重,1-α為商品品牌對計算商品最小支持度閾值的影響權重;
步驟三、以分類層次樹中具體商品層的上一層為類別,為每個類別設置類別最小支持度閾值:
其中,X‘、Xi、Xj均為商品的類別,Xi和Xj為X‘的子類別,λ為類別最小支持度閾值的影響參數;
步驟四、根據步驟二和步驟三中得到的商品最小支持度閾值和類別最小支持度閾值,利用多最小支持度關聯規則算法分別挖掘商品頻繁項集和類別頻繁項集,并產生相應的規則,具體如下:
(401)將所有商品按照自身的商品最小支持度閾值MIS進行升序排序,并存儲于項目集合M中;
(402)設I={i1,i2,...,im}為所有商品item的集合,事務數據集T=<T1,T2,...,Tn>表示網站所有用戶歷史商品交易記錄,其中每個事務Ti是用戶一次商品交易記錄,Ti是商品的集合,并且每個事務Ti都有一個唯一的標識符TID,m、n為正整數,掃描事務數據集T,計算其中每個商品的實際支持度sup(item);
(403)按存儲順序從項目集合M中找出第一個滿足sup(itemi)≥MIS(itemi)的項目itemi,將其加入集合L中,對于項目集合M中itemi之后的每個項目itemj,如果sup(itemj)≥MIS(itemi),則將itemj加入集合L中;
(404)在集合L中找到滿足sup(iteml)≥MIS(iteml)的所有商品iteml,并將iteml加入頻繁1項集F1中,并設定頻繁項集的基數k=2;
(405)判斷頻繁k-1項集Fk-1是否為空,若空則跳轉到步驟(408),否則進入步驟(406);
(406)若參數k=2,則按存儲順序遍歷集合L,對每個items∈L,若items滿足sup(items)≥MIS(items),對于集合L中items之后的每個itemh,在itemh滿足sup(itemh)≥MIS(items)且時,將候選項集{items,itemh}加入候選k項集Ck中,其中,為最大支持度差別;
若k≠2,則在頻繁k-1項集Fk-1中遍歷查找所有只有最后一項元素不同的頻繁項集對f1,f2,
f1={item1,item2,…,itemk-2,itemk-1},
f2={item1,item2,…,itemk-2,item′k-1},
若MIS(itemk-1)<MIS(item′k-1)且,則將候選項集c={item1,item2,…,itemk-2,itemk-1,item′k-1}加入候選k項集Ck中;
接著遍歷c中每個(k-1)大小的子集s,當c[1]∈s或者MIS(c[2])=MIS(c[1])時,如果則將候選k項集Ck中候選項集c刪除,其中,c[1]為候選項集c的第1個元素,c[2]為候選項集c的第2個元素;
(407)遍歷事務數據集T,計算候選k項集Ck中每個候選項集c的支持度sup(c),若候選項集c滿足sup(c)≥MIS(c[1]),則將候選項集c加入頻繁k項集Fk中,將參數k值加1,并跳轉到步驟(405);
(408)將各級頻繁項集Fk加入頻繁項集集合F中;
(409)由頻繁項集集合F產生關聯規則,對于k頻繁項集集合Fk∈F,其中k=2,3,...,對于每個k頻繁項集fk∈Fk,fk={item1,item2,...,itemk},由k頻繁項集fk生成的關聯規則過程如下:
對任一itemi∈fk,產生的關聯規則r形式為fk-itemi→itemi,此規則的真實置信度conf_of_r計算公式為:
conf_of_r=sup(fk)/sup(fk-itemi),
其中(fk-itemi)是k頻繁項集fk中去除itemi后剩余的所有item集合;由所有k頻繁項集集合Fk生成的關聯規則中,若關聯規則r的置信度conf_of_r≥minconf,則將此規則r加入到規則集R中;
步驟五、利用具體商品的規則為用戶進行個性化推薦,具體如下:
根據用戶的歷史購物記錄匹配商品關聯規則,當規則的前項A中的商品都是用戶曾經感興趣過的商品,且后項B中的商品不是用戶曾經感興趣過的商品時,將此規則加入候選規則集合,此規則后項B對應的商品itemf作為候選推薦商品;
對每個候選推薦商品itemf,計算分值
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于南京信息工程大學,未經南京信息工程大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201310688735.3/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:廣告顯示控制方法及裝置
- 下一篇:一種管理消防設施的方法





