[發(fā)明專利]一種播單推薦方法及系統(tǒng)有效
| 申請?zhí)枺?/td> | 201910227980.1 | 申請日: | 2019-03-25 |
| 公開(公告)號: | CN109982155B | 公開(公告)日: | 2021-10-12 |
| 發(fā)明(設計)人: | 寧宇光;王建興 | 申請(專利權)人: | 北京奇藝世紀科技有限公司 |
| 主分類號: | H04N21/482 | 分類號: | H04N21/482;H04N21/262;H04N21/25;H04N21/466;H04N21/435 |
| 代理公司: | 北京集佳知識產(chǎn)權代理有限公司 11227 | 代理人: | 王寶筠 |
| 地址: | 100080 北京市海淀*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 推薦 方法 系統(tǒng) | ||
1.一種播單推薦方法,其特征在于,包括:
根據(jù)歷史交互數(shù)據(jù)和內容屬性信息對播單數(shù)據(jù)庫進行篩選得到目標播單;
推送所述目標播單;
其中,所述根據(jù)歷史交互數(shù)據(jù)和內容屬性信息對播單數(shù)據(jù)庫進行篩選得到目標播單具體包括:
根據(jù)歷史交互數(shù)據(jù)和內容屬性信息對播單數(shù)據(jù)庫進行篩選得到播單候選集;
從預設數(shù)據(jù)庫中,查找所述播單候選集中每個所述播單的特征數(shù)據(jù),所述特征數(shù)據(jù)包括:用戶特征和播單特征;
將每個所述播單的特征數(shù)據(jù)作為點擊率預估模型的輸入,得到每個所述播單的點擊率預估值,所述點擊率預估模型為,以對播單的特征數(shù)據(jù)作為訓練樣本,以所述特征數(shù)據(jù)對應的點擊率預估值作為樣本標簽進行訓練得到;
基于第二預設篩選規(guī)則,從所述播單候選集中選取所述目標播單。
2.根據(jù)權利要求1所述的播單推薦方法,其特征在于,所述用戶特征包括:用戶ID、用戶歷史交互數(shù)據(jù)和標簽置信度,所述播單特征包括:播單ID、播單內容ID和播單標簽出現(xiàn)次數(shù)。
3.根據(jù)權利要求2所述的播單推薦方法,其特征在于,所述點擊率預估模型的建立過程包括:
從樣本數(shù)據(jù)集中選取熱度用戶樣本和所述熱度用戶樣本對應的目標值,非熱度用戶樣本和所述非熱度用戶樣本對應的目標值,構成模型訓練集,其中,所述模型訓練集中的所述熱度用戶樣本和所述非熱度用戶樣本數(shù)量相同,所述樣本數(shù)據(jù)集包括:播單樣本集和播單樣本集中每個樣本對應的目標值,所述目標值為播單的點擊率;
將所述模型訓練集中各個樣本的離散特征用one-hot表示,得到目標模型訓練集;
將所述目標模型訓練集帶入初始點擊率預估模型,得到所述點擊率預估模型的模型參數(shù);
基于所述模型參數(shù)建立點擊率預估模型。
4.一種播單推薦系統(tǒng),其特征在于,包括:
篩選單元,用于根據(jù)歷史交互數(shù)據(jù)和內容屬性信息對播單數(shù)據(jù)庫進行篩選得到目標播單;
推送單元,用于推送所述目標播單;
其中,所述篩選單元具體包括:
第二篩選子單元,用于根據(jù)歷史交互數(shù)據(jù)和內容屬性信息對播單數(shù)據(jù)庫進行篩選得到播單候選集;
查找子單元,用于從預設數(shù)據(jù)庫中,查找所述播單候選集中每個所述播單的特征數(shù)據(jù),所述特征數(shù)據(jù)包括:用戶特征和播單特征;
點擊率預估值獲取子單元,用于將每個所述播單的特征數(shù)據(jù)作為點擊率預估模型的輸入,得到每個所述播單的點擊率預估值,所述點擊率預估模型為,以對播單的特征數(shù)據(jù)作為訓練樣本,以所述特征數(shù)據(jù)對應的點擊率預估值作為樣本標簽進行訓練得到;
第二選取子單元,用于基于第二預設篩選規(guī)則,從所述播單候選集中選取所述目標播單。
5.根據(jù)權利要求4所述的播單推薦系統(tǒng),其特征在于,所述用戶特征包括:用戶ID、用戶歷史交互數(shù)據(jù)和標簽置信度,所述播單特征包括:播單ID、播單內容ID和播單標簽出現(xiàn)次數(shù)。
6.根據(jù)權利要求5所述的播單推薦系統(tǒng),其特征在于,所述篩選單元還包括:點擊率預估模型建立子單元,所述點擊率預估模型建立子單元用于:
從樣本數(shù)據(jù)集中選取熱度用戶樣本和所述熱度用戶樣本對應的目標值,非熱度用戶樣本和所述非熱度用戶樣本對應的目標值,構成模型訓練集,其中,所述模型訓練集中的所述熱度用戶樣本和所述非熱度用戶樣本數(shù)量相同,所述樣本數(shù)據(jù)集包括:播單樣本集和播單樣本集中每個樣本對應的目標值,所述目標值為播單的點擊率;
將所述模型訓練集中各個樣本的離散特征用one-hot表示,得到目標模型訓練集;
將所述目標模型訓練集帶入初始點擊率預估模型,得到所述點擊率預估模型的模型參數(shù);
基于所述模型參數(shù)建立點擊率預估模型。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京奇藝世紀科技有限公司,未經(jīng)北京奇藝世紀科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910227980.1/1.html,轉載請聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類





