[發明專利]文章推薦方法、裝置、電子設備和計算機介質在審
| 申請號: | 202110560244.5 | 申請日: | 2021-05-21 |
| 公開(公告)號: | CN113204705A | 公開(公告)日: | 2021-08-03 |
| 發明(設計)人: | 朱華煒 | 申請(專利權)人: | 天九共享網絡科技集團有限公司 |
| 主分類號: | G06F16/9535 | 分類號: | G06F16/9535;G06F40/289;G06K9/62 |
| 代理公司: | 北京英創嘉友知識產權代理事務所(普通合伙) 11447 | 代理人: | 賈會玲 |
| 地址: | 100012 北京市*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 文章 推薦 方法 裝置 電子設備 計算機 介質 | ||
本公開涉及一種文章推薦方法、裝置、電子設備和計算機介質,該方法包括:獲取目標用戶的行為數據;對每一歷史文章提取關鍵詞,并根據關鍵詞生成第一詞向量;對每一歷史文章,根據歷史文章的瀏覽操作數據,計算歷史文章的得分;將各歷史文章的得分,確定各歷史文章關鍵詞的第一詞向量的權重,并根據權重對各第一詞向量進行加權平均計算,得到表征目標用戶文章偏好的目標詞向量;對每一推薦備選文章計算推薦分值,其包括用于表征目標詞向量與推薦備選文章的文章詞向量的相似度的第一分值;將推薦分值滿足預設篩選條件的推薦備選文章作為目標推薦文章推薦給目標用戶。如此,在目標用戶的行為數據較少的情況下能準確推薦文章。
技術領域
本公開涉及推薦算法技術領域,具體地,涉及一種文章推薦方法、裝置、電子設備和計算機介質。
背景技術
為了讓用戶能夠準確閱讀到用戶感興趣的文章,提高用戶粘性,推薦系統服務也逐漸地被運用到資訊類網站或移動應用中。文章推薦系統可以根據用戶數據與文章內容,為用戶匹配文章資訊,使得用戶可以不受其他多余信息的干擾,直接查看到自身感興趣的文章資訊。目前的文章推薦系統主要采用的是基于內容的推薦算法。
基于內容的推薦算法主要根據用戶的當前及歷史的行為內容通過機器學習的方法計算得出當前用戶的相關內容標簽,然后再根據用戶的內容標簽進行內容的推薦。但是在用戶行為數據較少的情況下,得出的用戶內容標簽不夠準確,使文章內容的推薦精度較低。
發明內容
本公開的目的是提供一種文章推薦方法、裝置、電子設備和計算機介質,以解決現有技術中在用戶行為數據較少的情況下文章內容的推薦精度較低的問題。
為了實現上述目的,本公開第一方面提供一種文章推薦方法,該方法包括:
獲取目標用戶的行為數據,所述行為數據包括所述目標用戶瀏覽的歷史文章以及所述目標用戶對所述歷史文章的瀏覽操作數據;
對每一所述歷史文章提取關鍵詞,并根據所述關鍵詞生成第一詞向量;
針對每一所述歷史文章,根據所述歷史文章對應的所述瀏覽操作數據,計算所述歷史文章的得分;
將各所述歷史文章的得分,確定各所述歷史文章的關鍵詞對應的所述第一詞向量的權重,并根據所述權重對各所述第一詞向量進行加權平均計算,得到表征所述目標用戶的文章偏好的目標詞向量;
對每一推薦備選文章計算推薦分值,所述推薦分值包括第一分值,所述第一分值用于表征所述目標詞向量與所述推薦備選文章的文章詞向量之間的相似度;
將所述推薦分值滿足預設篩選條件的推薦備選文章作為目標推薦文章推薦給所述目標用戶。
可選地,所述方法還包括:
對所述行為數據按照預設時長劃分成多個時間段,并針對每一所述時間段內的歷史文章,執行所述對每一所述歷史文章提取關鍵詞,并根據所述關鍵詞生成第一詞向量,至所述得到表征所述目標用戶的文章偏好的目標詞向量的步驟,以得到對應每一所述時間段的目標詞向量;
針對每一所述目標詞向量,根據所述目標詞向量對應的所述時間段的權重,對所述目標詞向量進行加權處理,其中,所述時間段的權重隨著所述時間段在所述多個時間段內的早晚順序從早到晚依次增加;
所述第一分值是對每一加權處理后的所述目標詞向量與所述推薦備選文章的文章詞向量之間的相似度進行求和得到的。
可選地,所述推薦備選文章的文章詞向量的計算包括:
提取所述推薦備選文章的關鍵詞,并根據提取出的每一關鍵詞生成對應所述每一關鍵詞的第二詞向量;
對所述每一關鍵詞的第二詞向量求均值,得到所述文章詞向量。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于天九共享網絡科技集團有限公司,未經天九共享網絡科技集團有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110560244.5/2.html,轉載請聲明來源鉆瓜專利網。





