[發明專利]電子商務推薦模型的品牌特征提取方法及系統有效
| 申請號: | 201410593894.X | 申請日: | 2014-10-29 |
| 公開(公告)號: | CN104408641B | 公開(公告)日: | 2018-02-06 |
| 發明(設計)人: | 沈慧;范小朋;趙東輝;須成忠 | 申請(專利權)人: | 深圳先進技術研究院 |
| 主分類號: | G06Q30/02 | 分類號: | G06Q30/02 |
| 代理公司: | 深圳市科進知識產權代理事務所(普通合伙)44316 | 代理人: | 沈祖鋒,郝明琴 |
| 地址: | 518055 廣東省深圳*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 電子商務 推薦 模型 品牌 特征 提取 方法 系統 | ||
技術領域
本發明涉及一種電子商務推薦模型的品牌特征提取方法及系統。
背景技術
互聯網和信息技術的發展引發了思維方法、生活方式和商業模式的巨大變革。在全球商業語境下,“大數據時代”要求電商品牌運用海量數據處理系統對消費者從信息搜索到產品購買甚至購買后行為的跟蹤和搜索,針對消費者的需求做出更加實時和精細化的決策?;緜€性化推薦技術都需要從網站行為的日志信息中提取出用戶和品牌的特征信息,并通過特征選擇,消除無關和冗余特征,才能得到令人滿意的推薦效果。然而常規的網站日志信息事無巨細地包含了每個請求的詳細信息,冗余的信息中真正可以進行數據特征提取的只有用戶行為數據,包括點擊、購買、收藏、購物車等操作信息。
數據特征提取在數據管理和機器學習領域發揮著重要的作用,但是現有的數據特征化是指在保留數據特征的情況下減小原始數據的規模。數據特征化的工業背景隨著數據大規模增長,產生隱含大量有效信息的高維海量數據,若要在這些高價值總量,低價值密度的數據中發現有價值的知識,需要通過數據特征提取保留復雜數據中的有效信息,將低價值密度的信息轉化為高價值密度的信息。
目前的特征提取方法可以在已知豐富的基礎信息上提取得到所需的隱性特征,或者通過專業人事獲取業務相關的專業知識為背景。然而,在實際面臨的數據挖掘工程中,希望通過最稀少的信息構造出高維度且正交的數據特征是上述特征構建方案所不能實現的。
發明內容
有鑒于此,有必要提供一種電子商務推薦模型的品牌特征提取方法及系統。
本發明提供一種電子商務推薦模型的品牌特征提取方法,該方法包括如下步驟:對進行電子商務銷售的品牌的基礎數據進行時間分片,從而構造不同時間片的品牌特征序列;根據上述構造的不同時間片的品牌特征序列,對品牌的交易數據進行熱度和成本分析,提取品牌的特征。
其中,該方法還包括:對上述提取的品牌的特征進行數值修正。
所述的時間分片包括:常規的時間分片和基于購買行為的時間分片,其中所述常規的時間分片包括:按照自然日期分片、根據品牌每天的營銷狀況及時間懲罰因子分片、按照日期從近至遠間隔由短變長分片,所述基于購買行為的時間分片方式指把用戶對品牌的時間行為序列以購買日期為切分點。
所述的品牌的特征包括:品牌的轉化比、品牌的營銷周期、品牌的熱度、品牌再購買概率。
所述的數值修正指通過log函數的進行數值修正。
本發明還提供一種電子商務推薦模型的品牌特征提取系統,包括時間分片模塊、特征提取模塊,其中:所述時間分片模塊用于對進行電子商務銷售的品牌的基礎數據進行時間分片,從而構造不同時間片的品牌特征序列;所述特征提取模塊用于根據上述構造的不同時間片的品牌特征序列,對品牌的交易數據進行熱度和成本分析,提取品牌的特征。
其中,該系統還包括數值修正模塊,所述數值修正模塊用于對上述提取的品牌的特征進行數值修正。
所述的時間分片包括:常規的時間分片和基于購買行為的時間分片,其中所述常規的時間分片包括:按照自然日期分片、根據品牌每天的營銷狀況及時間懲罰因子分片、按照日期從近至遠間隔由短變長分片,所述基于購買行為的時間分片方式指把用戶對品牌的時間行為序列以購買日期為切分點。
所述的品牌的特征包括:品牌的轉化比、品牌的營銷周期、品牌的熱度、品牌再購買概率。
所述的數值修正指通過log函數的進行數值修正。
本發明電子商務推薦模型的品牌特征提取方法及系統,能夠使電子商務網站在海量數據基礎上,依據基本的用戶日志信息和品牌操作信息進行維度擴建,提取新的特征集合,構建推薦模型的品牌特征體系。本發明提取的數據價值高,提取效果好。
附圖說明
圖1為本發明電子商務推薦模型的品牌特征提取方法的流程圖;
圖2為基于購買行為的時間分片方式示意圖;
圖3為本發明電子商務推薦模型的品牌特征提取系統的硬件架構圖。
具體實施方式
下面結合附圖及具體實施例對本發明作進一步詳細的說明。
參閱圖1所示,是本發明電子商務推薦模型的品牌特征提取方法較佳實施例的作業流程圖。
步驟S401,對進行電子商務銷售的品牌的基礎數據進行時間分片,構造不同時間片的品牌特征序列。具體如下:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于深圳先進技術研究院,未經深圳先進技術研究院許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201410593894.X/2.html,轉載請聲明來源鉆瓜專利網。





