[發明專利]一種基于關鍵字的電子商務網站商品推薦方法有效
| 申請號: | 201210050057.3 | 申請日: | 2012-02-29 |
| 公開(公告)號: | CN102629257A | 公開(公告)日: | 2012-08-08 |
| 發明(設計)人: | 陳振宇;姚佳瑋;楊睿;姚嘉俊;周國兵 | 申請(專利權)人: | 南京大學;南京科泰信息技術有限公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30;G06Q30/02 |
| 代理公司: | 南京天翼專利代理有限責任公司 32112 | 代理人: | 黃明哲 |
| 地址: | 210093 江*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 關鍵字 電子商務 網站 商品 推薦 方法 | ||
1.一種基于關鍵字的電子商務網站商品推薦方法,其特征是用戶在搜索引擎搜索產品,由搜索鏈接進入電子商務網站,電子商務網站通過腳本采集搜索引擎鏈接帶入的關鍵字和相關產品信息,所述相關產品包括用戶瀏覽產品和下單產品,所述關鍵字和相關產品信息作為歷史數據保存為服務器上的日志;由關鍵字之間的關聯度得到關鍵字關聯表,由關鍵字和相關產品之間的索引關系,得到索引數據庫,將關鍵字關聯表和索引數據庫作為推薦基礎;當一個從搜索引擎過來的新用戶訪問電子商務網站時,解析用戶referrer取得關鍵字,并通過查詢關鍵字關聯表獲得拓展關鍵字,通過查找索引數據庫得到關鍵字和拓展關鍵字對應的商品列表,根據商品權重,推薦權重最高的N件商品。
2.根據權利要求1所述的一種基于關鍵字的電子商務網站商品推薦方法,其特征是具體步驟如下:
1)取得原始瀏覽數據:對日志進行處理,將指定日期范圍D內,相同會話下間隔時間不大于時長T的商品頁面訪問視為一次瀏覽,日期范圍D和時長T由電子商務網站設定,將一次瀏覽中初次訪問的referrerURL中的關鍵詞參數作為關鍵字字符串Q,處理完日志后,將獲得關鍵字字符串數據作為原始瀏覽數據;
2)生成關鍵字-商品索引:對一次瀏覽記錄中的關鍵字字符串Q進行處理,得到關鍵字集合K,具體處理方法如下:將關鍵字字符串Q按照空格分割,并根據預先定義的無用詞列表L去除無用詞,即:
將一次瀏覽記錄中所有被瀏覽過的商品記做商品集合P,將(Ki,Pj,Wji)寫入索引數據庫Index(K,P,W),其中:
Ki∈K,Pj∈P
權重Wji的計算中,C(Ki)表示關鍵字Ki在所有關鍵字字符串中的出現次數;C(Ki,Pj)表示關鍵字Ki和商品Pj在所有瀏覽記錄中同時出現的次數;
3)生成關鍵字關聯表:針對步驟2)中生成的所有關鍵字,根據jaccard公式計算兩兩之間的關聯度,如下:
A(Km,Kn)表示關鍵字Km和關鍵字Kn之間的關聯度,C(Km)為Km在歷史記錄中的出現次數,C(Kn)為Kn在歷史記錄中的出現次數,C(Km,Kn)為關鍵字Km和Kn共同出現在一條記錄中的次數,當A(Km,Kn)大于預先設定的閥值AT時,將(Km,Kn,A(Km,Kn))寫入關鍵字關聯表Assoc(K,K,A);
4)取得關鍵詞集合:當新用戶訪問網站時,通過腳本嘗試采集其搜索引擎帶入的關鍵字KS,方法同步驟2),記取得的關鍵字集合為如果無法取得關鍵字,則該用戶不屬于推薦目標;
5)擴展關鍵字:根據關鍵字關聯表生成擴展關鍵字集合方法如下:
Expand(Km)=∪{Kn|(Km,Kn,A(m,n))∈Assoc(K,K,A)}
k′為擴展的關鍵字;
6)計算商品權重:由索引數據庫Index(K,P,W)構造二部圖G(V,E),其中:
V=K∪P
E=∪{(Ki,Pj)|(Ki,Pj,Wji)∈(K,P,W)}
從二部圖中取出所有和相關的邊E’:
根據E’計算商品的權重:
其中α(Ki)是由電子商務網站設定的、用于區別來自和不同關鍵字的調整參數,
7)排序:將步驟6)中計算得到的W(Pj)按降序排列,推薦權重最高的N個商品。
3.根據權利要求1或2所述的一種基于關鍵字的電子商務網站商品推薦方法,其特征是所述腳本為JavaScript腳本。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于南京大學;南京科泰信息技術有限公司,未經南京大學;南京科泰信息技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201210050057.3/1.html,轉載請聲明來源鉆瓜專利網。





