[發明專利]一種基于分布式計算的互聯網信息投放渠道優化系統有效
| 申請號: | 201410289052.5 | 申請日: | 2014-06-24 |
| 公開(公告)號: | CN104133837B | 公開(公告)日: | 2017-10-31 |
| 發明(設計)人: | 張婭;魏逸;王宇晨 | 申請(專利權)人: | 上海交通大學 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 上海漢聲知識產權代理有限公司31236 | 代理人: | 郭國中 |
| 地址: | 200240 *** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 分布式 計算 互聯網 信息 投放 渠道 優化 系統 | ||
1.一種基于分布式計算的互聯網信息投放渠道優化系統,該系統包括:
數據收集模塊,該模塊通過web服務器收集用戶行為數據:將收集到的用戶行為分為兩部分,一部分記錄了某些用戶的全部瀏覽行為,另一部分記錄了同一信息不同渠道的訪問特征;
數據預處理模塊,該模塊是對web服務器收集的用戶行為數據進行處理,首先進行數據清理,采取忽略元祖及去除冗余的方法;隨后進行數據集成,對所收集到的數據的單位進行統一化處理;最后進行數據規約,將點擊時間轉化為模型參數,并最終形成包含用戶ID、信息投放渠道、時間和點擊這四個域的數據集;再將此數據集中的一部分提取出來,作為訓練集;其余數據集中的數據作為測試集;
訓練模塊,該模塊用類E-M算法對訓練集進行迭代運算,迭代至概率累加模型中的用戶影響強度因子α和影響隨時間衰減的因子ω收斂,從而得到參數α,ω;
信息投放渠道貢獻度預測模塊,該模塊的輸入為測試集,采用訓練模塊訓練出來的不同渠道對用戶影響強度因子α和影響隨時間衰減的因子ω作為模型參數,構建投放渠道m貢獻度,再根據每個投放渠道m的所屬網站或類型進行加和,得出各網站和各類型的貢獻度;最后根據各網站和各類型的貢獻度,由高到低進行排序,選用排名靠前的網站或類型來進行信息投放,以此來優化互聯網信息投放效果;
轉化率預測模塊,該模塊的輸入為測試集,首先,建立生存函數Su(t),然后利用1-Su(t)給每一個用戶進行評分,預測出最有可能轉化的用戶,并向這部分用戶推送信息。
2.根據權利要求1所述的基于分布式計算的互聯網信息投放渠道優化系統,其特征在于,所述數據收集模塊采用行為跟蹤的方法記錄下某些用戶的全部瀏覽行為;采用日志挖掘的方法,記錄下同一信息不同渠道的訪問特征,完成對于用戶信息的收集,并將用戶信息存儲于web服務器。
3.根據權利要求1所述的基于分布式計算的互聯網信息投放渠道優化系統,其特征在于,所述訓練模塊建立概率累加模型,即用戶行為條件強度函數λu(t):
其中:記用戶為集合{1,…,U},信息渠道為集合{1,…,n},觀察到的用戶行為為集合{C1,......,Cu},用戶u的行為記錄的結構為其中是用戶u第i次行為的信息投放渠道id,是用戶u第i次行為的時間,Xu是用戶轉化結果,Xu=1表示用戶轉化,Xu=0則反;lu是用戶u行為的總次數,如果用戶u轉化了,則tu代表轉化時間,否則代表觀察時間窗口節點;α為不同渠道投放的信息對用戶影響強度因子,ω為影響隨時間衰減的因子,k是信息投放渠道id,αk、ωk分別代表信息投放渠道k的影響強度因子和影響隨時間衰減的因子,Tu代表轉化時間或觀察時間窗口節點;
為表示用戶轉化率,建立生存函數Su(t),其中:
接著通過類EM算法迭代優化一下目標方程,使L(θ)獲得最大值;
其中E-step:
M-step:
令得:
即完成訓練過程。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于上海交通大學,未經上海交通大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201410289052.5/1.html,轉載請聲明來源鉆瓜專利網。





