[發明專利]一種基于分布式計算的互聯網信息投放渠道優化系統有效
| 申請號: | 201410289052.5 | 申請日: | 2014-06-24 |
| 公開(公告)號: | CN104133837B | 公開(公告)日: | 2017-10-31 |
| 發明(設計)人: | 張婭;魏逸;王宇晨 | 申請(專利權)人: | 上海交通大學 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 上海漢聲知識產權代理有限公司31236 | 代理人: | 郭國中 |
| 地址: | 200240 *** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 分布式 計算 互聯網 信息 投放 渠道 優化 系統 | ||
技術領域
本發明涉及互聯網技術領域,具體地是一種基于分布式計算的互聯網信息投放渠道優化系統。
背景技術
在過去的十幾年中,互聯網得以爆炸式發展,越來越多的人選擇上網社交、游戲、購物,互聯網信息推薦也成為了推廣產品的一個非常良好的途徑。這也使得各企業可以從中獲得大量的網絡數據來跟蹤推薦效果和投資回報率。
信息投放渠道貢獻度研究的目的就是量化不同渠道對于用戶轉化行為影響的大小。通過量化各渠道的貢獻度,可以比較不同市場渠道的價值,這些市場渠道包括電子郵件、聯盟營銷、顯示廣告、搜索廣告、社會媒體等,公司也可依據這些數據來決定未來對于不同投放渠道的投資力度,以求用最小的成本獲得大眾對于信息最大的關注度。
在現有技術中,互聯網信息投放渠道貢獻度預測的系統通常有三種:1、基于單源歸因模型的互聯網信息投放渠道貢獻度預測系統:此種系統中所用模型將所有貢獻都給了眾多事件中的一個事件,如基于最后點擊法(last-click)的系統、基于第一次點擊法(first-click)的系統等。這種系統被認為是非常不準確的,因為它忽略了那些事實上對于轉化行為產生了影響的事件。2、基于分數歸因模型的互聯網信息投放渠道貢獻度預測系統:此種系統中所用模型包括相同權重,客戶信用,U型曲線三種方式。相同權重就是給予所有投放渠道相同的權重??蛻粜庞镁褪歉鶕酝斗诺男Ч藶榈夭聹y并賦予不同的權重。U型曲線是將全部權重給第一次轉化和最后一次轉化,不考慮中間信息投放效果的影響。顯然,此系統的說服力也是不足的,事實上它們對于貢獻度的評估效果也并不良好。3、基于概率分布模型的互聯網信息投放渠道貢獻度預測系統:根據用戶所關注過的信息對用戶轉化行為的影響,給予這些渠道不同的貢獻度,然后對這些渠道的貢獻度進行整理、排序,以完成投放渠道貢獻度評估。顯然這種系統給予的預測才更精確,更合理。
發明內容
針對現有技術的不足,本發明的目的在于提供一種基于分布式計算的互聯網信息投放渠道優化系統,通過用戶的瀏覽行為優化信息投放渠道的選擇,更加準確地實現互聯網信息推薦,滿足用戶需求。
為實現上述目的,本發明采用了以下技術方案:
本發明提供一種基于分布式計算的互聯網信息投放渠道優化系統,該系統包括:數據收集模塊、數據預處理模塊、訓練模塊、信息投放渠道貢獻度預測模塊及轉化率預測模塊,其中:
數據收集模塊,該模塊通過web服務器收集用戶行為數據:將收集到的用戶行為分為兩部分,一部分記錄了某些用戶的全部瀏覽行為,另一部分記錄了同一信息不同渠道的訪問特征;
數據預處理模塊,該模塊是對服務器收集的用戶行為數據進行清理、集成、歸約,將收集到的用戶行為信息簡單化,規范化;
訓練模塊,該模塊的輸入為訓練集,并用類E-M算法進行迭代運算,迭代至概率累加模型中的用戶影響強度因子和影響隨時間衰減的因子這兩參數收斂,完成對這兩個參數的參數估計。
信息投放渠道貢獻度預測模塊,該模塊的輸入為測試集,構建信息投放渠道m貢獻度,再根據每個信息投放渠道m的所屬網站或類型進行加和,得出各網站和各類型的貢獻度;最后根據各網站和各類型的貢獻度,由高到低進行排序,選用排名靠前的網站或類型來進行信息推送,以此來獲取更好的投放效果;
轉化率預測模塊,該模塊的輸入為測試集,利用生存函數給每一個用戶進行評分,預測出最有可能發生轉化行為的用戶,并向這部分用戶推送互聯網信息。
基于Hadoop平臺的分布式計算,以上所有模塊中涉及到計算部分,均在Hadoop平臺進行,我們將復雜的計算分布到多個節點上進行,實現了多任務的并行處理,減少了任務間的等待,使得資源分配更加合理,運算速度得到極大地提升。
與現有技術相比,本發明具有以下有益效果:
本發明所提出的基于分布式計算的互聯網信息投放渠道優化系統,可以大大提高對于信息投放渠道貢獻度預測的準確性,從而方便選取最有效的網站或類型來投放信息;并且選出了最可能發生轉化的用戶人群,使信息推薦更有針對性。因此,能夠以最小的成本換取最好的推薦效果。另外,本發明的數據處理都是基于Hadoop平臺的,實現了多臺電腦的并行處理,大大降低了處理大數據時對于電腦運算能力及內存的要求,同時,極大提高了運算速度。
附圖說明
通過閱讀參照以下附圖對非限制性實施例所作的詳細描述,本發明的其它特征、目的和優點將會變得更明顯:
圖1是本發明一實施例中基于服務器的信息投放模型圖;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于上海交通大學,未經上海交通大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201410289052.5/2.html,轉載請聲明來源鉆瓜專利網。





