[發明專利]文章推薦方法、裝置、電子設備和計算機介質在審
| 申請號: | 202110560244.5 | 申請日: | 2021-05-21 |
| 公開(公告)號: | CN113204705A | 公開(公告)日: | 2021-08-03 |
| 發明(設計)人: | 朱華煒 | 申請(專利權)人: | 天九共享網絡科技集團有限公司 |
| 主分類號: | G06F16/9535 | 分類號: | G06F16/9535;G06F40/289;G06K9/62 |
| 代理公司: | 北京英創嘉友知識產權代理事務所(普通合伙) 11447 | 代理人: | 賈會玲 |
| 地址: | 100012 北京市*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 文章 推薦 方法 裝置 電子設備 計算機 介質 | ||
1.一種文章推薦方法,其特征在于,包括:
獲取目標用戶的行為數據,所述行為數據包括所述目標用戶瀏覽的歷史文章以及所述目標用戶對所述歷史文章的瀏覽操作數據;
對每一所述歷史文章提取關鍵詞,并根據所述關鍵詞生成第一詞向量;
針對每一所述歷史文章,根據所述歷史文章對應的所述瀏覽操作數據,計算所述歷史文章的得分;
將各所述歷史文章的得分,確定各所述歷史文章的關鍵詞對應的所述第一詞向量的權重,并根據所述權重對各所述第一詞向量進行加權平均計算,得到表征所述目標用戶的文章偏好的目標詞向量;
對每一推薦備選文章計算推薦分值,所述推薦分值包括第一分值,所述第一分值用于表征所述目標詞向量與所述推薦備選文章的文章詞向量之間的相似度;
將所述推薦分值滿足預設篩選條件的推薦備選文章作為目標推薦文章推薦給所述目標用戶。
2.根據權利要求1所述的方法,其特征在于,所述方法還包括:
對所述行為數據按照預設時長劃分成多個時間段,并針對每一所述時間段內的歷史文章,執行所述對每一所述歷史文章提取關鍵詞,并根據所述關鍵詞生成第一詞向量,至所述得到表征所述目標用戶的文章偏好的目標詞向量的步驟,以得到對應每一所述時間段的目標詞向量;
針對每一所述目標詞向量,根據所述目標詞向量對應的所述時間段的權重,對所述目標詞向量進行加權處理,其中,所述時間段的權重隨著所述時間段在所述多個時間段內的早晚順序從早到晚依次增加;
所述第一分值是對每一加權處理后的所述目標詞向量與所述推薦備選文章的文章詞向量之間的相似度進行求和得到的。
3.根據權利要求1所述的方法,其特征在于,所述推薦備選文章的文章詞向量的計算包括:
提取所述推薦備選文章的關鍵詞,并根據提取出的每一關鍵詞生成對應所述每一關鍵詞的第二詞向量;
對所述每一關鍵詞的第二詞向量求均值,得到所述文章詞向量。
4.根據權利要求1所述的方法,其特征在于,所述行為數據還包括所述目標用戶瀏覽過的欄目以及所述目標用戶對所述欄目的瀏覽操作數據,相應地,所述推薦備選文章是通過如下方式選擇的:
根據所述目標用戶對所述欄目的瀏覽操作數據,確定所述欄目的瀏覽操作分值;
根據預設的推薦備選文章總數量,以及每個所述欄目的瀏覽操作分值與所有欄目的瀏覽操作分值的和的比例關系,從每個所述欄目下選取推薦備選文章。
5.根據權利要求1-4中任一項所述的方法,其特征在于,所述推薦分值還包括第二分值,所述第二分值的計算包括:
將所述推薦備選文章的文章詞向量以及所述目標用戶的行為數據輸入訓練完成的協同過濾模型中,得到所述協同過濾模型輸出的所述第二分值,所述協同過濾模型是基于所有用戶的行為數據訓練得到的。
6.根據權利要求1-4中任一項所述的方法,其特征在于,所述推薦分值還包括第三分值,所述第三分值的計算包括:
根據所述推薦備選文章的發布時間確定所述推薦備選文章對應的時間權重,其中,所述時間權重用于表征所述推薦備選文章按照時間的衰減程度;
將預設的第一基礎分值與所述時間權重的乘積為所述第三分值。
7.根據權利要求1-4中任一項所述的方法,其特征在于,所述推薦分值還包括第四分值,所述第四分值的計算包括:
根據所述推薦備選文章所在的欄目中的文章數量,確定所述欄目對應的預設分值;
將預設的第二基礎分值與所述預設分值的差作為所述第四分值。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于天九共享網絡科技集團有限公司,未經天九共享網絡科技集團有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110560244.5/1.html,轉載請聲明來源鉆瓜專利網。





