[發明專利]視頻推薦的方法、裝置、電子設備和存儲介質在審
| 申請號: | 202110420279.9 | 申請日: | 2021-04-19 |
| 公開(公告)號: | CN113065027A | 公開(公告)日: | 2021-07-02 |
| 發明(設計)人: | 杜東;蔡慧慧 | 申請(專利權)人: | 騰訊科技(深圳)有限公司 |
| 主分類號: | G06F16/783 | 分類號: | G06F16/783;G06F16/9535;G06F40/194;G06F40/30;G06N20/00 |
| 代理公司: | 深圳市隆天聯鼎知識產權代理有限公司 44232 | 代理人: | 甄偉軍 |
| 地址: | 518057 廣東省深圳*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 視頻 推薦 方法 裝置 電子設備 存儲 介質 | ||
本申請提供一種視頻推薦的方法、裝置、電子設備和存儲介質。該視頻推薦的方法包括:獲取待推薦視頻的第一關聯文本,其中,第一關聯文本包括K個字符;對第一關聯文本進行編碼處理,得到第一編碼序列,其中,第一編碼序列包括K個概率值,概率值用于表示所對應的字符屬于有效字符的概率;根據第一編碼序列以及第一關聯文本,生成第一文本表達向量;根據第一文本表達向量以及第二文本表達向量,確定句子相似度;若句子相似度大于推薦閾值,則向用戶推薦待推薦視頻。該方法避免由于無效字符而使得推薦結果與用于進行推薦的目標視頻的內容差距過大,提升推薦的準確性以及用戶體驗。
技術領域
本申請涉及計算機技術領域,尤其涉及一種視頻推薦的方法、裝置、電子設備和存儲介質。
背景技術
短視頻是目前占用用戶時長最久的應用形態之一。短視頻應用的生態系統通常包含平臺方、內容生產者以及內容消費者。短視頻的推薦通常分為召回、粗排序、精排序以及混合排序等幾個階段。通過多種召回策略通過不同的排列組合方式最終在模型排序后展現給用戶。
目前,短視頻推薦通常基于視頻內容的學習推薦方式,根據視頻中內容將視頻向量化表征,根據用戶瀏覽過的視頻的向量化表征來查找具有相似內容的視頻來進行視頻推薦。
然而,由于短視頻的文本中包含的無意義內容經常具有較高的相似度,在推薦模型的學習和運行過程中,無意義內容的存在會導致視頻之間的相似度升高,從而降低視頻推薦的準確性。
發明內容
基于上述技術問題,本申請提供一種視頻推薦的方法,以提升視頻推薦的準確性以及用戶體驗。
本申請的其他特性和優點將通過下面的詳細描述變得顯然,或部分地通過本申請的實踐而習得。
根據本申請實施例的一個方面,提供一種視頻推薦的方法,包括:
獲取待推薦視頻的第一關聯文本,其中,所述第一關聯文本包括K個字符,所述K為大于或等于1的整數;
對所述第一關聯文本進行編碼處理,得到第一編碼序列,其中,所述第一編碼序列包括K個概率值,每個概率值對應于一個字符,所述概率值用于表示所對應的字符屬于有效字符的概率;
根據所述第一編碼序列以及所述第一關聯文本,生成第一文本表達向量;
根據所述第一文本表達向量以及第二文本表達向量,確定句子相似度,其中,所述第二文本表達向量是根據歷史視頻的第二關聯文本生成的,所述歷史視頻為用戶瀏覽過的視頻;
若所述句子相似度大于推薦閾值,則向所述用戶推薦所述待推薦視頻。
根據本申請實施例的一個方面,提供一種視頻推薦裝置,包括:
第一文本獲取模塊,用于獲取待推薦視頻的第一關聯文本,其中,所述第一關聯文本包括K個字符,所述K為大于或等于1的整數;
第一編碼處理模塊,用于對所述第一關聯文本進行編碼處理,得到第一編碼序列,其中,所述第一編碼序列包括K個概率值,每個概率值對應于一個字符,所述概率值用于表示元素所對應的字符屬于有效字符的概率;
第一表達生成模塊,用于根據所述第一編碼序列以及所述第一關聯文本,生成第一文本表達向量;
相似度模塊,用于根據所述第一文本表達向量以及第二文本表達向量,確定句子相似度,其中,所述第二文本表達向量是根據歷史視頻的第二關聯文本生成的,所述歷史視頻為用戶瀏覽過的視頻;
推薦模塊,用于若所述句子相似度大于推薦閾值,則向所述用戶推薦所述待推薦視頻。
在本申請的一些實施例中,基于以上技術方案,第一編碼處理模塊包括:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于騰訊科技(深圳)有限公司,未經騰訊科技(深圳)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110420279.9/2.html,轉載請聲明來源鉆瓜專利網。





