[發明專利]一種預測APP沖榜所需廣告投放量的方法在審
| 申請號: | 201710755057.6 | 申請日: | 2017-08-29 |
| 公開(公告)號: | CN107527243A | 公開(公告)日: | 2017-12-29 |
| 發明(設計)人: | 王秋文;李百川 | 申請(專利權)人: | 有米科技股份有限公司 |
| 主分類號: | G06Q30/02 | 分類號: | G06Q30/02 |
| 代理公司: | 廣州市華學知識產權代理有限公司44245 | 代理人: | 黃磊,陳宏升 |
| 地址: | 510006 廣東省廣州市番*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 預測 app 廣告 投放 方法 | ||
1.一種預測APP沖榜所需廣告投放量的方法,其特征在于,包含以下步驟:
S1、提取沖榜數據特征,構成沖榜數據訓練集;
S2、通過獲取的沖榜數據訓練集,訓練機器學習模型:采用Gradient Boost Regression Tree來訓練模型,最終得到GBRT模型;
S3、利用訓練出的GBRT模型,預測目標沖榜APP的廣告投放量。
2.根據權利要求1所述預測APP沖榜所需廣告投放量的方法,其特征在于,步驟S1中,所述沖榜數據包括沖榜APP自有屬性、歷史沖榜數據。
3.根據權利要求2所述預測APP沖榜所需廣告投放量的方法,其特征在于,所述沖榜APP自有屬性包括每個APP的類別、更新時間、APP大小、開發商信息。
4.根據權利要求2所述預測APP沖榜所需廣告投放量的方法,其特征在于,所述歷史沖榜數據包括從歷史數據中提取每次沖榜的APP名、分榜ID、總榜開始位置、總榜結束位置、分榜開始位置、分榜結束位置、投放量、沖榜開始時間、沖榜結束時間。
5.根據權利要求1所述預測APP沖榜所需廣告投放量的方法,其特征在于,所述步驟S2具體如下:
假設x、y分別為輸入變量、輸出變量,即x為輸入特征值,y為廣告投放量的真實值;
給定數據量為N的訓練集D:
D={(x1,y1),(x2,y2),...,(xN,yN)};
其中x1、x2、…、xN為歷史沖榜特征數據,y1、y2、…、yN為歷史廣告投放量的真實值;
該模型的損失函數為:
L(y,f(x));
上式中,f(x)為沖榜所需廣告投放量的預測模型;
初始化f(x):
依次建立M棵決策樹;
上式中,L為損失函數,yi為第i個廣告投放量的真實值,c為首顆樹得到的常數值;
A、對N個數據分別計算:
上式中,xi為訓練集中第i個廣告投放的特征向量;rmi為第m棵樹計算第i個廣告投放記錄的負梯度;m為當前建立的樹序號,即正在計算的樹是第m棵;f(xi)為第i個投放沖榜所需廣告投放量的預測模型;fm-1(xi)為前m-1棵數得到的投放沖榜所需廣告投放量的預測模型;
B、對{(xi,rmi)},i=1,2,...,N擬合回歸樹hm(x);
假設hm(x)得到Jm個葉子節點,則這棵樹將輸入空間劃分為Jm個區域:Rmj,j=1,2,...,Jm,每個區域擁有一個常量預測值bmj,利用指示函數I可表示為:
C、求解最優化模型,得到算子cm:
上式中,hm(xi)為第m棵樹第i個歷史投放的預測結果;
D、更新:fm(x)=fm-1(x)+cmhm(x)
最終得到GBRT模型:
6.根據權利要求1所述預測APP沖榜所需廣告投放量的方法,其特征在于,所述GBRT模型,若榜單排名規則沒有更改,則多次重復使用;如果有更改,則需要用更改之后的沖榜數據重新訓練模型。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于有米科技股份有限公司,未經有米科技股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710755057.6/1.html,轉載請聲明來源鉆瓜專利網。





