[發(fā)明專利]一種商品推薦方法、裝置及系統(tǒng)有效
| 申請?zhí)枺?/td> | 202110474256.6 | 申請日: | 2021-04-29 |
| 公開(公告)號: | CN113239268B | 公開(公告)日: | 2023-04-07 |
| 發(fā)明(設計)人: | 陳繼鐘;霍穎瑜;陳勇輝;許可;楊祥檳;李治輝 | 申請(專利權)人: | 佛山科學技術學院 |
| 主分類號: | G06F16/9535 | 分類號: | G06F16/9535;G06F16/9536;G06F40/211;G06F40/242;G06F40/289;G06Q30/0601 |
| 代理公司: | 廣州嘉權專利商標事務所有限公司 44205 | 代理人: | 葉潔勇 |
| 地址: | 528011 廣東*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 商品 推薦 方法 裝置 系統(tǒng) | ||
1.一種商品推薦方法,其特征在于,所述方法包括以下步驟:
步驟S100、獲取預先收集的歷史商品信息,從所述歷史商品信息中提取待切分中文句,根據(jù)所述待切分中文句建立商品的特征詞表;
步驟S200、確定與用戶行為關聯(lián)的商品,獲取所述商品的商品信息,根據(jù)所述特征詞表刪除所述商品信息中不屬于所述特征詞表的特征詞,得到所述商品的商品特征項;
步驟S300、基于所述商品特征項建立用戶畫像信息表,其中,所述用戶畫像信息表包括列表區(qū)和特征項序列,所述列表區(qū)包括每個商品的商品標識和商品權重,所述特征項序列為所述列表區(qū)中全部商品權重的集合;
步驟S400、從所述用戶畫像信息表中的特征項序列中篩選出特征序列,作為該用戶的用戶畫像;
步驟S500、基于目標用戶的用戶畫像確定目標用戶的近鄰用戶,從所述近鄰用戶的列表區(qū)中確定目標用戶的商品推薦列表;
其中,步驟S100中,所述根據(jù)所述待切分中文句建立商品的特征詞表包括:
步驟S110、取待切分中文句的c個字符作為待匹配字段,將所述待匹配字段與詞典進行查找匹配,將匹配成功的待匹配字段作為一個詞切分出來;其中,c為詞典中最長詞條的字符數(shù);
步驟S120、將匹配不成功的待匹配字段的最后一個字去掉,將所述待匹配字段中剩下的字符串作為新的匹配字段,對所述新的匹配字段進行再次匹配,直到所述待匹配字段中的所有字段均完成匹配;
步驟S130、將全部切分得到的詞形成詞表,將所述詞表與預先設置的停用詞表進行遍歷匹配,將所述詞表中匹配到的詞進行刪除,得到有效詞表;
步驟S140、采用TF-IDF算法確定所述有效詞表中每個詞的詞頻,將所述有效詞表中詞頻較高的詞刪掉,得到商品的特征詞表;
所述步驟S300包括:
步驟S310、對所述商品的商品特征項賦予行為權重,得到商品權重,基于目標商品的商品標識和商品權重建立列表區(qū);
步驟S320、基于所述列表區(qū)中全部商品權重的集合建立特征項序列;
步驟S330、基于所述列表區(qū)和特征項序列建立用戶畫像信息表;其中,所述用戶畫像信息表包括列表區(qū)和特征項序列;所述列表區(qū)包括商品的編碼item_id和每個商品的商品權重Q_Clear_word;特征項序列為所述列表區(qū)中全部商品權重Q_Clear_word的集合;其中,瀏覽行為的權重為J,收藏行為的權重為K,購買行為的權重為L,其中,J、K、L∈N*,N*表示正自然數(shù)集;
所述步驟S400包括:
步驟S410、確定所述特征項序列中每個商品特征項的權重;
步驟S420、對所述特征項序列中的所有商品特征項分別進行權重賦值,得到所有商品特征項的權值;
步驟S430、從所有商品特征項中選取權值最大的N個商品特征項,作為目標用戶的特征序列,用于表示該目標用戶的用戶畫像;其中,所述用戶畫像信息表中的特征項序列表示為Segment=S(W1,W2,…,Wn),其中,每個所述特征項序列中包含n個商品特征項,Wt表示第t個商品特征項,1≤t≤n;每個商品特征項都對應一個權重,所述特征項序列采用商品特征項與權重來表示,即S(W1,Q1;W2,Q2;……Wn,Qn),簡記為S(W1,W2,…,Wn),其中Qt是Wt的權重;N=m×n;其中,m表示特征序列的總數(shù),n表示每個所述特征項序列中包含的商品特征項,N表示全部特征項的總數(shù),1≤i≤m,1≤j≤n;
商品特征項的權重計算公式為:
其中,nj表示特征項序列中包含商品特征項j的特征序列數(shù),tfij表示商品特征項j在特征序列i中出現(xiàn)的頻率,Wij表示特征序列i中商品特征項j的權重;
選取權值最大的N個商品特征項,重新組成該用戶的特征序列,用于表示該用戶的畫像,目標用戶的畫像表示為Icon(W1,W2,……,Wn);
所述步驟S500包括:
步驟S510、將所有用戶的用戶畫像劃分為多個分類簇;
步驟S520、基于目標用戶的用戶畫像,從目標用戶所在的分類簇中求得多個最近鄰用戶;從所述多個最近鄰用戶的列表區(qū)中確定目標用戶的推薦列表;
所述步驟S510包括:
步驟S511、設所有用戶的用戶畫像組成的用戶畫像集為D,D=(D1,D2,Di,…,Dp),在用戶畫像集D中隨機設定k個初始質心點S,S=(S1,S2,Sj,…,Sk),根據(jù)所述k個初始質心點對所述用戶畫像集D進行簇分配,其中,p為用戶的總數(shù);
步驟S512、當任意一個初始質心點的簇分配結果發(fā)生改變時,計算每個初始質心點與所述用戶畫像集中的每個用戶畫像之間的距離,將所述用戶畫像分配到距離最近的初始質心點所在的簇;
步驟S513、將每個簇中所有用戶畫像的均值更新為該簇的質心點,直至目標函數(shù)達到最小,所述目標函數(shù)為:
其中,Di為用戶畫像集D中的第i個用戶畫像,Sj為第j個質心點;
所述步驟S520包括:
步驟S521、確定目標用戶的用戶畫像所在的簇中的K個最近鄰用戶;
步驟S522、分別確定K個最近鄰用戶的特征序列中TF-IDF值最大的商品特征項,得到K個商品特征項MAX_K;
步驟S523、從所述K個最近鄰用戶的列表區(qū)中尋找有商品特征項存在于所述K個商品特征項MAX_K中的商品,作為推薦商品,將所述推薦商品的商品標識進行記錄,得到所述目標用戶的推薦列表;
所述步驟S521包括:
確定目標用戶所在的簇人數(shù)是否≤K,若是,則該目標用戶的最近鄰為該用戶所在簇中的所有其他用戶;若否,確定該目標用戶與簇中其他用戶的相似度sim(i,j);
對計算得到的相似度排序,取相似度最大的K個用戶作為該目標用戶的K-最近鄰用戶;
所述方法還包括:
根據(jù)用戶畫像中特征序列的長度確定所述特征序列的衰減周期,以所述衰減周期對所述特征序列中的全部商品特征項進行衰減;
當所述特征序列中的商品特征項衰減到0時,將該商品特征項移出用戶畫像中的特征序列;所述衰減周期的計算公式如下:
X=3.2L0-0.13;
L0=L-Lmin;
其中,X為衰減周期,L為用戶畫像中特征項序列的長度,Lmin為特征項序列的最小長度,L0>0。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于佛山科學技術學院,未經(jīng)佛山科學技術學院許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110474256.6/1.html,轉載請聲明來源鉆瓜專利網(wǎng)。





