[發(fā)明專利]內(nèi)容推送方法及存儲介質(zhì)、計算機設(shè)備有效
| 申請?zhí)枺?/td> | 201811497834.2 | 申請日: | 2018-12-07 |
| 公開(公告)號: | CN109359247B | 公開(公告)日: | 2021-07-06 |
| 發(fā)明(設(shè)計)人: | 聶照昌 | 申請(專利權(quán))人: | 廣州市百果園信息技術(shù)有限公司 |
| 主分類號: | G06F16/9535 | 分類號: | G06F16/9535 |
| 代理公司: | 北京市立方律師事務(wù)所 11330 | 代理人: | 劉延喜 |
| 地址: | 511442 廣東省廣州市番禺區(qū)南村*** | 國省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 內(nèi)容 推送 方法 存儲 介質(zhì) 計算機 設(shè)備 | ||
本發(fā)明提供一種內(nèi)容推送方法及存儲介質(zhì)、計算機設(shè)備,所述方法包括:提取待推送內(nèi)容的多個相關(guān)特征;將所述多個相關(guān)特征輸入基于特征組合的點擊率預(yù)估模型,得到所述待推送內(nèi)容的預(yù)估點擊率;其中,所述基于特征組合的點擊率預(yù)估模型用于將所述多個相關(guān)特征進(jìn)行組合,根據(jù)組合后的所述相關(guān)特征的關(guān)聯(lián)性,確定出所述待推送內(nèi)容的預(yù)估點擊率;根據(jù)所述待推送內(nèi)容的預(yù)估點擊率,向用戶推送內(nèi)容。該方法可提高向用戶推送內(nèi)容的精準(zhǔn)度。并且,該方法無需進(jìn)行人工篩選組合特征,可減少人工量。
技術(shù)領(lǐng)域
本發(fā)明涉及數(shù)據(jù)處理技術(shù)領(lǐng)域,具體而言,本發(fā)明涉及一種內(nèi)容推送方法及存儲介質(zhì)、計算機設(shè)備。
背景技術(shù)
隨著互聯(lián)網(wǎng)技術(shù)的快速發(fā)展,人類進(jìn)入了大數(shù)據(jù)時代。這給互聯(lián)網(wǎng)用戶和互聯(lián)網(wǎng)平臺帶來了新的挑戰(zhàn)。對于用戶而言,從大量信息中獲取自己感興趣的信息的難度逐漸增加。對于平臺而言,如何給每位用戶推薦個性化的信息/廣告并以此獲取收益也逐漸變成了平臺的關(guān)鍵任務(wù)之一。因此,個性化推薦技術(shù)受到了越來越多的關(guān)注。點擊率(Click-through Rate,CTR)預(yù)估是個性化推薦中的一項核心關(guān)鍵技術(shù),通過機器學(xué)習(xí)方法建立模型,用于預(yù)測“如果給一位用戶推薦某個信息/廣告,該用戶會點擊的概率”。一個好的點擊率預(yù)估模型可以大大提升互聯(lián)網(wǎng)平臺的收益。
業(yè)界CTR預(yù)估的場景中,采集的特征往往都是大規(guī)模離散稀疏化的。比如在淘寶的場景中,商品的數(shù)量成千上萬,每一個商品會有對應(yīng)的id,假設(shè)模型需要使用到商品某個特征,則需要用一個成千上萬維的向量去表示商品的該特征。而CTR預(yù)估場景中特征之間可能存在比較強的相關(guān)性,比如衣服和性別,這兩個特征明顯存在一個很強的關(guān)聯(lián)關(guān)系。當(dāng)衣服具體表現(xiàn)為“裙子”,性別為“女”時,用戶點擊的概率會提高。目前在工業(yè)界,絕大多數(shù)推薦系統(tǒng)工程師需要挖掘出強相關(guān)的特征組合。但是挖掘有效的特征組合,需要大量的人工工作,也需要一定的跨領(lǐng)域知識,并且需要不斷地嘗試,對于推薦系統(tǒng)工程師來說是一個很繁重的任務(wù)。
發(fā)明內(nèi)容
本發(fā)明提出一種內(nèi)容推送方法及存儲介質(zhì)、計算機設(shè)備,實現(xiàn)自動化挖掘內(nèi)容推送的關(guān)聯(lián)特征以向用戶進(jìn)行內(nèi)容推送,提高內(nèi)容推送的精準(zhǔn)度,并減少人工量。
本發(fā)明提供以下方案:
一種內(nèi)容推送方法,包括:提取待推送內(nèi)容的多個相關(guān)特征;將所述多個相關(guān)特征輸入基于特征組合的點擊率預(yù)估模型,得到所述待推送內(nèi)容的預(yù)估點擊率;其中,所述基于特征組合的點擊率預(yù)估模型用于將所述多個相關(guān)特征進(jìn)行組合,根據(jù)組合后的所述相關(guān)特征的關(guān)聯(lián)性,確定出所述待推送內(nèi)容的預(yù)估點擊率;根據(jù)所述待推送內(nèi)容的預(yù)估點擊率,向用戶推送內(nèi)容。
在一實施例中,所述待推送內(nèi)容包括待推送的短視頻內(nèi)容;所述提取待推送內(nèi)容的多個相關(guān)特征,包括:提取所述待推送的短視頻內(nèi)容的多個用戶特征以及多個短視頻內(nèi)容特征;所述將所述多個相關(guān)特征輸入基于特征組合的點擊率預(yù)估模型,得到所述待推送內(nèi)容的預(yù)估點擊率,包括:將所述多個用戶特征以及所述多個短視頻內(nèi)容特征輸入所述基于特征組合的點擊率預(yù)估模型,得到所述待推送的短視頻內(nèi)容的預(yù)估點擊率;所述根據(jù)所述待推送內(nèi)容的預(yù)估點擊率,向用戶推送內(nèi)容,包括:根據(jù)所述待推送的短視頻內(nèi)容的預(yù)估點擊率,向用戶推送短視頻內(nèi)容。
在一實施例中,所述基于特征組合的點擊率預(yù)估模型包括:輸入層,用于對所述多個相關(guān)特征進(jìn)行獨熱編碼,得到獨熱向量;邏輯回歸組件,用于對所述輸入層輸出的所述獨熱向量進(jìn)行邏輯回歸運算,得到第一運算值;嵌套模塊,用于將所述獨熱向量的高維度稀疏離散化特征轉(zhuǎn)換成低維度連續(xù)值特征,得到低維度連續(xù)值向量;內(nèi)積組件,用于將所述嵌套模塊輸出的所述低維度連續(xù)值向量進(jìn)行向量內(nèi)積,得到第二運算值;拼接模塊,用于將所述嵌套模塊輸出的所述低維度連續(xù)值向量進(jìn)行向量拼接,得到拼接向量;隱藏層模塊,用于將所述拼接模塊輸出的所述拼接向量輸入深度神經(jīng)網(wǎng)絡(luò)隱藏層,得到第三運算值;預(yù)估點擊率運算模塊,用于根據(jù)所述第一運算值、所述第二運算值及所述第三運算值計算出所述待推送內(nèi)容的預(yù)估點擊率。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于廣州市百果園信息技術(shù)有限公司,未經(jīng)廣州市百果園信息技術(shù)有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811497834.2/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 內(nèi)容再現(xiàn)系統(tǒng)、內(nèi)容提供方法、內(nèi)容再現(xiàn)裝置、內(nèi)容提供裝置、內(nèi)容再現(xiàn)程序和內(nèi)容提供程序
- 內(nèi)容記錄系統(tǒng)、內(nèi)容記錄方法、內(nèi)容記錄設(shè)備和內(nèi)容接收設(shè)備
- 內(nèi)容服務(wù)系統(tǒng)、內(nèi)容服務(wù)器、內(nèi)容終端及內(nèi)容服務(wù)方法
- 內(nèi)容分發(fā)系統(tǒng)、內(nèi)容分發(fā)裝置、內(nèi)容再生終端及內(nèi)容分發(fā)方法
- 內(nèi)容發(fā)布、內(nèi)容獲取的方法、內(nèi)容發(fā)布裝置及內(nèi)容傳播系統(tǒng)
- 內(nèi)容提供裝置、內(nèi)容提供方法、內(nèi)容再現(xiàn)裝置、內(nèi)容再現(xiàn)方法
- 內(nèi)容傳輸設(shè)備、內(nèi)容傳輸方法、內(nèi)容再現(xiàn)設(shè)備、內(nèi)容再現(xiàn)方法、程序及內(nèi)容分發(fā)系統(tǒng)
- 內(nèi)容發(fā)送設(shè)備、內(nèi)容發(fā)送方法、內(nèi)容再現(xiàn)設(shè)備、內(nèi)容再現(xiàn)方法、程序及內(nèi)容分發(fā)系統(tǒng)
- 內(nèi)容再現(xiàn)裝置、內(nèi)容再現(xiàn)方法、內(nèi)容再現(xiàn)程序及內(nèi)容提供系統(tǒng)
- 內(nèi)容記錄裝置、內(nèi)容編輯裝置、內(nèi)容再生裝置、內(nèi)容記錄方法、內(nèi)容編輯方法、以及內(nèi)容再生方法





