[發明專利]一種最大化利益的熱門商品榜單制定方法有效
| 申請號: | 201810335230.1 | 申請日: | 2018-04-13 |
| 公開(公告)號: | CN108573408B | 公開(公告)日: | 2021-07-27 |
| 發明(設計)人: | 曹斌;侯晨煜;范菁 | 申請(專利權)人: | 浙江工業大學 |
| 主分類號: | G06Q30/02 | 分類號: | G06Q30/02 |
| 代理公司: | 杭州天正專利事務所有限公司 33201 | 代理人: | 王兵;黃美娟 |
| 地址: | 310014 浙江省杭州*** | 國省代碼: | 浙江;33 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 最大化 利益 熱門 商品 制定 方法 | ||
1.一種最大化利益的熱門商品榜單制定方法,包括如下步驟:
步驟1.數據預處理;
以天為時間粒度,將歷史數據按照天為間隔進行劃分,然后提取能夠反映物品熱門程度的各種特征,最終總結為三大類特征:統計類特征、轉換類特征和比值類特征;在異常數據清洗方面,使用帕累托法則對特征數據進行清洗;最后把商品在第二天是否上榜的信息作為標簽數據,與之前提取的特征數據組合成最終的訓練數據集;
提取的三大類特征具體說明如下:
統計類特征:加入購物車次數、從購物車刪除次數、購買次數、瀏覽量、瀏覽人數、瀏覽時長、加入購物車人數、從購物車刪除人數、購買人數;
轉化率類特征:瀏覽量/瀏覽人數、瀏覽時長/瀏覽人數、加入購物車人數/瀏覽人數、從購物車刪除人數/瀏覽人數、購買人數/瀏覽人數;
比值類特征:返客率、老客戶率、跳出率、活躍度;
步驟2.潛在熱門上榜商品集的篩選;
設計了基于時間衰減的隨機森林分類模型TDRF對商品的特征數據進行學習和預測,為每個商品計算第二天上榜的概率,記為上榜置信度X_Trust;然后通過設置閾值的策略,將X_Trust過低的商品過濾;經過這一方法,可以從海量的商品集合中篩選出較小的商品集合作為潛在熱門上榜商品;
將隨機森林與時間衰減函數相結合,用于潛在熱門上榜商品集的分類篩選;首先利用歷史數據為每一天訓練一個隨機森林模型,再將最新一天的商品特征輸入到歷史的隨機森林模型中分別預測上榜概率,記做{c1,c2,…,ct},其中t表示使用的訓練模型距離預測日期的天數之差;然后引入時間衰減函數,對之前預測的上榜概率進行,具體的時間衰減函數如下:
公式中t表示使用的訓練數模型距離預測日期的天數之差,α是一個參數,用來控制衰減速度;通過時間衰減函數,能夠懲罰較舊的訓練數據得到的上榜概率值,從而更加合理地預測熱門榜單;為了保證所有上榜概率的權重之和等于1,需要對衰減權重進行歸一化處理,計算公式如下所示:
最終,第二天商品的X_Trust通過如下公式計算:
XTrust(c,w)=w1c1+w2c2+…+wtct (4)
步驟3.潛在熱門商品集的重排序并制定榜單;
用基于行為數據的重排序模型BBRR將物品的歷史數據與X_Trust相結合,對候選集中的物品計算排序分數,最終根據排序分數進行重排序,快速且準確的得到最終的熱門商品預測排行榜單;在重排序的過程中,結合商品前一天的瀏覽量Pv、瀏覽人數Uv以及排行情況LRS,還結合了商品發布到目前的天數Ad,商品最近被瀏覽到目前的天數Ld;具體的計算方式如下所示:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于浙江工業大學,未經浙江工業大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810335230.1/1.html,轉載請聲明來源鉆瓜專利網。





