[發(fā)明專利]信息流媒體廣告創(chuàng)意推薦方法及裝置在審
| 申請?zhí)枺?/td> | 201910962318.0 | 申請日: | 2019-10-11 |
| 公開(公告)號: | CN110728541A | 公開(公告)日: | 2020-01-24 |
| 發(fā)明(設(shè)計)人: | 羅毅;羅文輝;招偉錦;楊忠軒;呂子鋒 | 申請(專利權(quán))人: | 廣州市豐申網(wǎng)絡(luò)科技有限公司 |
| 主分類號: | G06Q30/02 | 分類號: | G06Q30/02;G06F16/9535 |
| 代理公司: | 11534 北京奧文知識產(chǎn)權(quán)代理事務(wù)所(普通合伙) | 代理人: | 張文;苗麗娟 |
| 地址: | 510623 廣東省廣州市*** | 國省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 向量 用戶人群 素材數(shù)據(jù) 效果數(shù)據(jù) 媒體廣告 存儲 信息流 數(shù)據(jù)庫 預處理 廣告投放數(shù)據(jù) 數(shù)據(jù)預處理 數(shù)據(jù)挖掘 效果評估 點擊率 概率 構(gòu)建 輸出 觀看 | ||
本發(fā)明公開了提供了一種信息流媒體廣告創(chuàng)意推薦方法及裝置,該方法包括:構(gòu)建底層存儲,底層存儲對應(yīng)的數(shù)據(jù)庫內(nèi)存儲有廣告投放數(shù)據(jù)。從數(shù)據(jù)庫內(nèi)獲取文案數(shù)據(jù)、素材數(shù)據(jù)、創(chuàng)意效果數(shù)據(jù)和用戶人群數(shù)據(jù)。對文案數(shù)據(jù)、素材數(shù)據(jù)、創(chuàng)意效果數(shù)據(jù)和用戶人群數(shù)據(jù)進行數(shù)據(jù)預處理。對預處理后的文案數(shù)據(jù)、素材數(shù)據(jù)、創(chuàng)意效果數(shù)據(jù)和用戶人群數(shù)據(jù)進行數(shù)據(jù)挖掘和特征工程,獲取用戶向量、創(chuàng)意向量和One?Hot向量。將用戶向量、創(chuàng)意向量和One?Hot向量輸入Wide&Deep模型,Wide&Deep模型輸出創(chuàng)意推薦給對應(yīng)用戶人群的概率y,y∈【0,1】。根據(jù)創(chuàng)意推薦給對應(yīng)用戶人群的概率進行效果評估。本發(fā)明的信息流媒體廣告創(chuàng)意推薦方法及裝置,可以提高用戶在觀看創(chuàng)意時的點擊率。
技術(shù)領(lǐng)域
本發(fā)明涉及廣告推薦技術(shù)領(lǐng)域,尤其涉及一種信息流媒體廣告創(chuàng)意推薦方法及裝置。
背景技術(shù)
創(chuàng)意是由素材(圖片)和文案(文字)構(gòu)成,目前在信息流媒體創(chuàng)意推薦領(lǐng)域中,采取的主流結(jié)構(gòu)是輸入素材、文案內(nèi)容以及創(chuàng)意效果數(shù)據(jù),選用機器學習模型去構(gòu)建CTR預估模型,CTR(Click-Through-Rate)即點擊通過率,在此具體指的是該創(chuàng)意的實際點擊次數(shù)除以創(chuàng)意的展現(xiàn)量。
業(yè)界傳統(tǒng)的CTR預估解法是廣義線性模型LR(logistic regression,邏輯斯特回歸)+人工特征工程。LR使用了Logit變換將函數(shù)值映射到[0,1]區(qū)間,映射后的函數(shù)值就是CTR的預估值。LR這種線性模型很容易并行化,處理上億條訓練樣本不是問題。但這種解法的不足是,因為線性模型的學習能力有限,需要引入大量的領(lǐng)域知識來人工設(shè)計特征以及特征之間的交叉組合來間接補充算法的非線性學習能力,非常消耗人力和機器資源,遷移性不夠友好。此外還有常見的Tree based方法,這種方法雖然能夠有效解決LR模型的特征組合問題,但缺點就是仍然是對歷史行為的記憶,泛化能力差。還有像FM(factorizationmachine)模型,能自動學習高階屬性的權(quán)值,不用通過人工的方式選取特征來做交叉,但FM模型只能擬合特定的非線性模式,無法自動做特征交叉,運算量隨著數(shù)據(jù)量成冪數(shù)倍增長。并且,由于當前主流模型一般只使用創(chuàng)意(素材和文案)本身的特征變量和它的效果數(shù)據(jù),沒有與所推薦的用戶群體構(gòu)建聯(lián)系,導致創(chuàng)意推薦模型離線效果較好但線上表現(xiàn)不盡如意。
發(fā)明內(nèi)容
為解決上述現(xiàn)有技術(shù)中存在的技術(shù)問題,本發(fā)明提供了一種信息流媒體廣告創(chuàng)意推薦方法及裝置。具體技術(shù)方案如下:
第一方面,提供了一種信息流媒體廣告創(chuàng)意推薦方法,所述方法包括:
構(gòu)建底層存儲,所述底層存儲對應(yīng)的數(shù)據(jù)庫內(nèi)存儲有廣告投放數(shù)據(jù);
從所述數(shù)據(jù)庫內(nèi)獲取文案數(shù)據(jù)、素材數(shù)據(jù)、創(chuàng)意效果數(shù)據(jù)和用戶人群數(shù)據(jù);
對所述文案數(shù)據(jù)、素材數(shù)據(jù)、創(chuàng)意效果數(shù)據(jù)和用戶人群數(shù)據(jù)進行數(shù)據(jù)預處理;
對預處理后的所述文案數(shù)據(jù)、素材數(shù)據(jù)、創(chuàng)意效果數(shù)據(jù)和用戶人群數(shù)據(jù)進行數(shù)據(jù)挖掘和特征工程,獲取用戶向量、創(chuàng)意向量和One-Hot向量;
將所述用戶向量、創(chuàng)意向量和One-Hot向量輸入Wide&Deep模型,采取梯度下降算法更新模型權(quán)重數(shù)值,得到降低模型損失的效果,所述Wide&Deep模型輸出創(chuàng)意推薦給對應(yīng)用戶人群的概率y,y∈【0,1】;
根據(jù)所述創(chuàng)意推薦給對應(yīng)用戶人群的概率進行效果評估。
在一種可能的設(shè)計中,數(shù)據(jù)預處理包括:數(shù)據(jù)歸一化、缺失值處理、編碼格式統(tǒng)一和無效特征處理。
在一種可能的設(shè)計中,通過下述轉(zhuǎn)化函數(shù)進行數(shù)據(jù)歸一化:
x2=(x1-u)/σ
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于廣州市豐申網(wǎng)絡(luò)科技有限公司,未經(jīng)廣州市豐申網(wǎng)絡(luò)科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910962318.0/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
- 一種數(shù)字視頻制作方法
- 一種畫中畫數(shù)字視頻制作方法
- 一種基于互聯(lián)網(wǎng)大數(shù)據(jù)的數(shù)字視頻制作方法
- 一種用于在線學習的電子課件及生成方法
- 一種用于在線學習的電子課件播放方法及系統(tǒng)
- 基于互聯(lián)網(wǎng)大數(shù)據(jù)的數(shù)字視頻制作系統(tǒng)
- 一種基于大數(shù)據(jù)的公共教育培訓素材共享系統(tǒng)及工作方法
- 動態(tài)素材數(shù)據(jù)處理方法、系統(tǒng)、計算機和可讀存儲介質(zhì)
- 一種素材數(shù)據(jù)處理智能系統(tǒng)
- 素材審核采購方法、裝置、設(shè)備及存儲介質(zhì)





