[發明專利]一種播單推薦方法及系統有效
| 申請號: | 201910227980.1 | 申請日: | 2019-03-25 |
| 公開(公告)號: | CN109982155B | 公開(公告)日: | 2021-10-12 |
| 發明(設計)人: | 寧宇光;王建興 | 申請(專利權)人: | 北京奇藝世紀科技有限公司 |
| 主分類號: | H04N21/482 | 分類號: | H04N21/482;H04N21/262;H04N21/25;H04N21/466;H04N21/435 |
| 代理公司: | 北京集佳知識產權代理有限公司 11227 | 代理人: | 王寶筠 |
| 地址: | 100080 北京市海淀*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 推薦 方法 系統 | ||
本發明公開了一種播單推薦方法及系統,根據歷史交互數據和內容屬性信息對播單數據庫進行篩選,得到用于推送的目標播單,相對于傳統方案只適合推動因素較為單一的內容,本發明在確定目標播單時,同時結合了歷史交互數據和內容屬性信息兩方面內容,因此使得推薦的目標播單更為準確,可以很好地匹配播單形式的推薦,從而提高了用戶體驗。
技術領域
本發明涉及視頻技術領域,更具體的說,涉及一種播單推薦方法及系統。
背景技術
在內容推送類軟件產品中,隨著可推送內容數量不斷豐富,用戶對內容推薦引擎使用率的快速提升。當用戶進行內容搜索時,內容推薦引擎可以為用戶推薦包含多個符合搜索條件的播單。
播單作為一種封裝有多項內容的合集形式,已經廣泛應用于內容推送類軟件產品中。由于播單中包含的特征數據更加多元化,現有的推薦技術通常只適合推送因素較為單一的內容,而無法很好地匹配播單形式的推薦,從而影響用戶體驗。
發明內容
有鑒于此,本發明公開一種播單推薦方法及系統,以實現在確定目標播單時,同時結合歷史交互數據和內容屬性信息兩方面內容,使得推薦的目標播單更為準確,可以很好地匹配播單形式的推薦,從而提高用戶體驗。
一種播單推薦方法,包括:
根據歷史交互數據和內容屬性信息對播單數據庫進行篩選得到目標播單;
推送所述目標播單。
可選的,所述根據歷史交互數據和內容屬性信息對播單數據庫進行篩選得到目標播單,具體包括:
根據用戶標簽和用戶標簽置信度構建用戶特征向量;
根據播單標簽和播單標簽置信度構建播單特征向量;
采用余弦公式計算所述用戶特征向量和所述播單特征向量的相似度;
基于相似度數值和第一預設篩選規則選取所述目標播單。
可選的,所述根據歷史交互數據和內容屬性信息對播單數據庫進行篩選得到目標播單,具體包括:
獲取預設時間段內的歷史交互數據,構建歷史交互數據向量;
基于所述播單中各個內容屬性,構建播單向量;
基于所述歷史交互數據向量和所述播單向量,計算有過歷史交互數據的內容在每個播單中的占比;
選取占比大于或等于占比閾值的播單,得到所述目標播單。
可選的,所述根據歷史交互數據和內容屬性信息對播單數據庫進行篩選得到目標播單,具體包括:
根據歷史交互數據和內容屬性信息對播單數據庫進行篩選得到播單候選集;
從預設數據庫中,查找所述播單候選集中每個所述播單的特征數據,所述特征數據包括:用戶ID、用戶歷史交互數據、播單ID、播單內容ID、標簽置信度和播單標簽出現次數;
將每個所述播單的特征數據作為點擊率預估模型的輸入,得到每個所述播單的點擊率預估值,所述點擊率預估模型為,以對播單的特征數據作為訓練樣本,以所述特征數據對應的點擊率預估值作為樣本標簽進行訓練得到;
基于第二預設篩選規則,從所述播單候選集中選取所述目標播單。
可選的,所述點擊率預估模型的建立過程包括:
從樣本數據集中選取熱度用戶樣本和所述熱度用戶樣本對應的目標值,非熱度用戶樣本和所述非熱度用戶樣本對應的目標值,構成模型訓練集,其中,所述模型訓練集中的所述熱度用戶樣本和所述非熱度用戶樣本數量相同,所述樣本數據集包括:播單樣本集和播單樣本集中每個樣本對應的目標值,所述目標值為播單的點擊率;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京奇藝世紀科技有限公司,未經北京奇藝世紀科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910227980.1/2.html,轉載請聲明來源鉆瓜專利網。





