[發(fā)明專(zhuān)利]一種基于分布式計(jì)算的互聯(lián)網(wǎng)信息投放渠道優(yōu)化系統(tǒng)有效
| 申請(qǐng)?zhí)枺?/td> | 201410289052.5 | 申請(qǐng)日: | 2014-06-24 |
| 公開(kāi)(公告)號(hào): | CN104133837B | 公開(kāi)(公告)日: | 2017-10-31 |
| 發(fā)明(設(shè)計(jì))人: | 張婭;魏逸;王宇晨 | 申請(qǐng)(專(zhuān)利權(quán))人: | 上海交通大學(xué) |
| 主分類(lèi)號(hào): | G06F17/30 | 分類(lèi)號(hào): | G06F17/30 |
| 代理公司: | 上海漢聲知識(shí)產(chǎn)權(quán)代理有限公司31236 | 代理人: | 郭國(guó)中 |
| 地址: | 200240 *** | 國(guó)省代碼: | 上海;31 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 分布式 計(jì)算 互聯(lián)網(wǎng) 信息 投放 渠道 優(yōu)化 系統(tǒng) | ||
1.一種基于分布式計(jì)算的互聯(lián)網(wǎng)信息投放渠道優(yōu)化系統(tǒng),該系統(tǒng)包括:
數(shù)據(jù)收集模塊,該模塊通過(guò)web服務(wù)器收集用戶(hù)行為數(shù)據(jù):將收集到的用戶(hù)行為分為兩部分,一部分記錄了某些用戶(hù)的全部瀏覽行為,另一部分記錄了同一信息不同渠道的訪問(wèn)特征;
數(shù)據(jù)預(yù)處理模塊,該模塊是對(duì)web服務(wù)器收集的用戶(hù)行為數(shù)據(jù)進(jìn)行處理,首先進(jìn)行數(shù)據(jù)清理,采取忽略元祖及去除冗余的方法;隨后進(jìn)行數(shù)據(jù)集成,對(duì)所收集到的數(shù)據(jù)的單位進(jìn)行統(tǒng)一化處理;最后進(jìn)行數(shù)據(jù)規(guī)約,將點(diǎn)擊時(shí)間轉(zhuǎn)化為模型參數(shù),并最終形成包含用戶(hù)ID、信息投放渠道、時(shí)間和點(diǎn)擊這四個(gè)域的數(shù)據(jù)集;再將此數(shù)據(jù)集中的一部分提取出來(lái),作為訓(xùn)練集;其余數(shù)據(jù)集中的數(shù)據(jù)作為測(cè)試集;
訓(xùn)練模塊,該模塊用類(lèi)E-M算法對(duì)訓(xùn)練集進(jìn)行迭代運(yùn)算,迭代至概率累加模型中的用戶(hù)影響強(qiáng)度因子α和影響隨時(shí)間衰減的因子ω收斂,從而得到參數(shù)α,ω;
信息投放渠道貢獻(xiàn)度預(yù)測(cè)模塊,該模塊的輸入為測(cè)試集,采用訓(xùn)練模塊訓(xùn)練出來(lái)的不同渠道對(duì)用戶(hù)影響強(qiáng)度因子α和影響隨時(shí)間衰減的因子ω作為模型參數(shù),構(gòu)建投放渠道m(xù)貢獻(xiàn)度,再根據(jù)每個(gè)投放渠道m(xù)的所屬網(wǎng)站或類(lèi)型進(jìn)行加和,得出各網(wǎng)站和各類(lèi)型的貢獻(xiàn)度;最后根據(jù)各網(wǎng)站和各類(lèi)型的貢獻(xiàn)度,由高到低進(jìn)行排序,選用排名靠前的網(wǎng)站或類(lèi)型來(lái)進(jìn)行信息投放,以此來(lái)優(yōu)化互聯(lián)網(wǎng)信息投放效果;
轉(zhuǎn)化率預(yù)測(cè)模塊,該模塊的輸入為測(cè)試集,首先,建立生存函數(shù)Su(t),然后利用1-Su(t)給每一個(gè)用戶(hù)進(jìn)行評(píng)分,預(yù)測(cè)出最有可能轉(zhuǎn)化的用戶(hù),并向這部分用戶(hù)推送信息。
2.根據(jù)權(quán)利要求1所述的基于分布式計(jì)算的互聯(lián)網(wǎng)信息投放渠道優(yōu)化系統(tǒng),其特征在于,所述數(shù)據(jù)收集模塊采用行為跟蹤的方法記錄下某些用戶(hù)的全部瀏覽行為;采用日志挖掘的方法,記錄下同一信息不同渠道的訪問(wèn)特征,完成對(duì)于用戶(hù)信息的收集,并將用戶(hù)信息存儲(chǔ)于web服務(wù)器。
3.根據(jù)權(quán)利要求1所述的基于分布式計(jì)算的互聯(lián)網(wǎng)信息投放渠道優(yōu)化系統(tǒng),其特征在于,所述訓(xùn)練模塊建立概率累加模型,即用戶(hù)行為條件強(qiáng)度函數(shù)λu(t):
其中:記用戶(hù)為集合{1,…,U},信息渠道為集合{1,…,n},觀察到的用戶(hù)行為為集合{C1,......,Cu},用戶(hù)u的行為記錄的結(jié)構(gòu)為其中是用戶(hù)u第i次行為的信息投放渠道id,是用戶(hù)u第i次行為的時(shí)間,Xu是用戶(hù)轉(zhuǎn)化結(jié)果,Xu=1表示用戶(hù)轉(zhuǎn)化,Xu=0則反;lu是用戶(hù)u行為的總次數(shù),如果用戶(hù)u轉(zhuǎn)化了,則tu代表轉(zhuǎn)化時(shí)間,否則代表觀察時(shí)間窗口節(jié)點(diǎn);α為不同渠道投放的信息對(duì)用戶(hù)影響強(qiáng)度因子,ω為影響隨時(shí)間衰減的因子,k是信息投放渠道id,αk、ωk分別代表信息投放渠道k的影響強(qiáng)度因子和影響隨時(shí)間衰減的因子,Tu代表轉(zhuǎn)化時(shí)間或觀察時(shí)間窗口節(jié)點(diǎn);
為表示用戶(hù)轉(zhuǎn)化率,建立生存函數(shù)Su(t),其中:
接著通過(guò)類(lèi)EM算法迭代優(yōu)化一下目標(biāo)方程,使L(θ)獲得最大值;
其中E-step:
M-step:
令得:
即完成訓(xùn)練過(guò)程。
該專(zhuān)利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專(zhuān)利權(quán)人授權(quán)。該專(zhuān)利全部權(quán)利屬于上海交通大學(xué),未經(jīng)上海交通大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買(mǎi)此專(zhuān)利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201410289052.5/1.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專(zhuān)利網(wǎng)。
- 上一篇:一種具有智能檢測(cè)功能的數(shù)據(jù)處理方法及系統(tǒng)
- 下一篇:創(chuàng)建數(shù)據(jù)報(bào)表業(yè)務(wù)的方法和相關(guān)裝置及業(yè)務(wù)系統(tǒng)
- 同類(lèi)專(zhuān)利
- 專(zhuān)利分類(lèi)
G06F 電數(shù)字?jǐn)?shù)據(jù)處理
G06F17-00 特別適用于特定功能的數(shù)字計(jì)算設(shè)備或數(shù)據(jù)處理設(shè)備或數(shù)據(jù)處理方法
G06F17-10 .復(fù)雜數(shù)學(xué)運(yùn)算的
G06F17-20 .處理自然語(yǔ)言數(shù)據(jù)的
G06F17-30 .信息檢索;及其數(shù)據(jù)庫(kù)結(jié)構(gòu)
G06F17-40 .數(shù)據(jù)的獲取和記錄
G06F17-50 .計(jì)算機(jī)輔助設(shè)計(jì)
- 基于網(wǎng)絡(luò)電視的互聯(lián)網(wǎng)業(yè)務(wù)處理方法和系統(tǒng)
- 互聯(lián)網(wǎng)業(yè)務(wù)接入網(wǎng)關(guān)的實(shí)現(xiàn)方法和系統(tǒng)
- 一種互聯(lián)網(wǎng)電視終端安全訪問(wèn)互聯(lián)網(wǎng)的方法
- 一種互聯(lián)網(wǎng)應(yīng)用交互方法、裝置及系統(tǒng)
- 一種使用互聯(lián)網(wǎng)移動(dòng)攝像終端進(jìn)行異地圖像拍攝的系統(tǒng)
- 一種網(wǎng)絡(luò)電視終端安全訪問(wèn)互聯(lián)網(wǎng)的方法
- 利用區(qū)塊鏈保護(hù)用于互聯(lián)網(wǎng)資源分配的事務(wù)
- 互聯(lián)網(wǎng)廣告裝置及方法
- 中央管理服務(wù)器的互聯(lián)網(wǎng)連接方法及系統(tǒng)
- 互聯(lián)網(wǎng)節(jié)點(diǎn)中信任傳播方法、系統(tǒng)及相關(guān)產(chǎn)品





