[發明專利]一種新聞點擊率預測算法在審
| 申請號: | 202010011789.6 | 申請日: | 2020-01-07 |
| 公開(公告)號: | CN111245649A | 公開(公告)日: | 2020-06-05 |
| 發明(設計)人: | 鄭紀偉;黃修斌 | 申請(專利權)人: | 上海二三四五網絡科技有限公司 |
| 主分類號: | H04L12/24 | 分類號: | H04L12/24 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 200137 上海市浦*** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 新聞 點擊率 預測 算法 | ||
1.一種新聞點擊率預測算法,基于已觀測到的點擊次數Ci、展示次數Ii對新聞點擊率ri進行預測,其特征在于,所述新聞點擊率ri通過如下公式計算:
ri=(Ci+α^)/(Ii+α^+β^);
其中,所述α^為參數α的估計,所述β^為參數β的估計。
2.根據權利要求1所述的算法,其特征在于,通過求解如下最大似然函數來計算所述α^以及所述β^,其中,誤差在第一閾值范圍內的α^和β^的解為所述最大似然函數的解:
P(C1,C2,...,CN|I1,I2,...,IN,α,β);
其中,所述(C1,C2,...,CN)為觀測到的點擊數據,所述(I1,I2,...,IN)表示廣告被展示的次數。
3.根據權利要求2所述的算法,其特征在于,通過如下步驟求解所述最大似然函數:
a.基于與所述參數α相關聯的第一初始值、與所述參數β相關聯的第二初始值,構造似然函數的一個下界函數,其中,所述下界函數可以求得所述下界函數最大值處的閉式解;
b.將上述閉式解作為新的估計,并重復上述步驟a,直至收斂。
4.根據權利要求3所述的算法,其特征在于,所述第一初始值和/或所述第二初始值通過如下步驟計算獲得:
α=[mean*(1-mean)/var-1]*mean;
β=[mean*(1-mean)/var-1]*(1-mean);
其中,
mean=E(x)=α/(α+β);
var=D(x)=αβ/(α+β)2(α+β+1)。
5.根據權利要求1所述的算法,其特征在于,通過SparkStreaming程序將用戶行為記錄在zookeeper節點上,其中,所述用戶行為至少包括所述點擊次數Ci。
6.根據權利要求1所述的算法,其特征在于,通過Kafka分布式消息中間件對所述用戶行為進行采集,其中,所述用戶行為至少包括所述點擊次數Ci。
7.根據權利要求5或6所述的算法,其特征在于,所述用戶行為還至少包括如下操作或指令中任一種或任多種:
-滑動窗口;
-對窗口執行放大、縮小操作;以及
-下拉滾動條。
8.根據權利要求1所述的算法,其特征在于,基于已觀測到的點擊次數Ci、展示次數Ii以及時間衰減對新聞點擊率ri進行預測,所述新聞點擊率ri還可以通過如下公式計算:
ri=(Ci+α^)/(Ii+α^+β^)(T+1);
其中,所述α^為參數α的估計,所述β^為參數β的估計,所述T為第一次曝光距離現在的時間。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于上海二三四五網絡科技有限公司,未經上海二三四五網絡科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010011789.6/1.html,轉載請聲明來源鉆瓜專利網。





