[發明專利]一種基于關鍵字的電子商務網站商品推薦方法有效
| 申請號: | 201210050057.3 | 申請日: | 2012-02-29 |
| 公開(公告)號: | CN102629257A | 公開(公告)日: | 2012-08-08 |
| 發明(設計)人: | 陳振宇;姚佳瑋;楊睿;姚嘉俊;周國兵 | 申請(專利權)人: | 南京大學;南京科泰信息技術有限公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30;G06Q30/02 |
| 代理公司: | 南京天翼專利代理有限責任公司 32112 | 代理人: | 黃明哲 |
| 地址: | 210093 江*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 關鍵字 電子商務 網站 商品 推薦 方法 | ||
技術領域
本發明屬于個性化推薦領域,基于用戶在搜索引擎中輸入的關鍵字對電子網站的新用戶進行推薦,為一種基于關鍵字的電子商務網站商品推薦方法。
背景技術
個性化推薦是根據用戶的興趣特點和購買行為,向用戶推薦用戶感興趣的信息和商品。隨著電子商務規模的不斷擴大,商品個數和種類快速增長,用戶需要花費大量的時間才能找到自己需要的商品。這種瀏覽大量無關的信息和產品過程無疑會使淹沒在信息過載問題中的消費者不斷流失。為了解決這些問題,個性化推薦系統應運而生。個性化推薦系統是建立在海量數據挖掘基礎上的一種高級商務智能平臺,以幫助電子商務網站為其用戶提供完全個性化的決策支持和信息服務。
目前主流的個性化推薦系統主要采用的方法是內容過濾,協同過濾推薦和兩者的混合推薦。然而,盡管推薦系統的較之過去已經取得長足的發展,目前這一代的推薦系統依然存在著一些需要更多努力去改進的缺陷。隨著市場應用需求的不斷改變升級,目前的推薦系統主要存在以下幾種明顯的弊端:1.新網站的冷啟動問題;2.網站新用戶沒有可供分析的歷史數據的問題;3.難以應對變化的用戶偏好問題;4.難以應對不斷加大的數據集處理問題等等。
本發明方法著力解決的問題便是針對新用戶的問題。新用戶不存在任何行為記錄,難以刻畫其特征進行購買預測和商品推薦。所以傳統的個性化推薦方法很難對這個問題進行直接應用。
發明內容
本發明所要解決的技術問題是:電子商務網站的用戶中新用戶的比例很高,很多新用戶是在下單購買時才注冊登錄,一個電子商務網站的新用戶既沒有歷史行為信息數據,如歷史評分,瀏覽,購買等行為,大部分情況也沒有人口統計信息數據,如年齡,性別,職業等,所以傳統的推薦方法難以滿足這個特殊場景的需要。
本發明的技術方案為:一種基于關鍵字的電子商務網站商品推薦方法,用戶在搜索引擎搜索產品,由搜索鏈接進入電子商務網站,電子商務網站通過腳本采集搜索引擎鏈接帶入的關鍵字和相關產品信息,所述相關產品包括用戶瀏覽產品和下單產品,所述關鍵字和相關產品信息作為歷史數據保存為服務器上的日志;由關鍵字之間的關聯度得到關鍵字關聯表,由關鍵字和相關產品之間的索引關系,得到索引數據庫,將關鍵字關聯表和索引數據庫作為推薦基礎;當一個從搜索引擎過來的新用戶訪問電子商務網站時,解析用戶referrer取得關鍵字,并通過查詢關鍵字關聯表獲得拓展關鍵字,通過查找索引數據庫得到關鍵字和拓展關鍵字對應的商品列表,根據商品權重,推薦權重最高的N件商品。
本發明具體步驟如下:
1)取得原始瀏覽數據:對日志進行處理,將指定日期范圍D內,相同會話下間隔時間不大于時長T的商品頁面訪問視為一次瀏覽,日期范圍D和時長T由電子商務網站設定,將一次瀏覽中初次訪問的referrer?URL中的關鍵詞參數作為關鍵字字符串Q,處理完日志后,將獲得關鍵字字符串數據作為原始瀏覽數據;
2)生成關鍵字-商品索引:對一次瀏覽記錄中的關鍵字字符串Q進行處理,得到關鍵字集合K,具體處理方法如下:將關鍵字字符串Q按照空格分割,并根據預先定義的無用詞列表L去除無用詞,即:
將一次瀏覽記錄中所有被瀏覽過的商品記做商品集合P,將(Ki,Pj,Wji)寫入索引數據庫Index(K,P,W),其中:
Ki∈K,Pj∈P
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于南京大學;南京科泰信息技術有限公司,未經南京大學;南京科泰信息技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201210050057.3/2.html,轉載請聲明來源鉆瓜專利網。





