[發明專利]文章推薦方法、裝置、設備及存儲介質在審
| 申請號: | 201911147597.1 | 申請日: | 2019-11-21 |
| 公開(公告)號: | CN112825089A | 公開(公告)日: | 2021-05-21 |
| 發明(設計)人: | 張新宇;張伸正 | 申請(專利權)人: | 騰訊科技(北京)有限公司 |
| 主分類號: | G06F16/9535 | 分類號: | G06F16/9535 |
| 代理公司: | 北京派特恩知識產權代理有限公司 11270 | 代理人: | 王姍姍;張穎玲 |
| 地址: | 100080 北京市海淀區海淀*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 文章 推薦 方法 裝置 設備 存儲 介質 | ||
1.一種文章推薦方法,其特征在于,所述方法包括:
從待推薦對象的畫像信息中,提取至少兩個興趣標簽;
根據每一所述興趣標簽的權重,對所述至少兩個興趣標簽進行采樣,得到索引詞集合;
確定與索引詞集合中的索引詞相匹配的候選文章集合;
確定所述候選文章集合中每一候選文章與所述畫像信息之間的匹配度;
根據所述匹配度,對所述候選文章集合進行采樣,得到待推薦的目標文章集合。
2.根據權利要求1所述的方法,其特征在于,所述從待推薦對象的畫像信息中,提取至少兩個興趣標簽,包括:
從所述畫像信息中,選擇表征所述待推薦對象的興趣領域的興趣標簽和表征所述待推薦對象的興趣目標的興趣標簽,以得到所述至少兩個興趣標簽。
3.根據權利要求1所述的方法,其特征在于,所述根據每一所述興趣標簽的權重,對所述至少兩個興趣標簽進行采樣,得到索引詞集合,包括:
對所述興趣標簽的權重進行排序,得到第一排序結果;
根據所述第一排序結果,確定第一采樣概率;
采用所述第一采樣概率對所述至少兩個興趣標簽進行采樣,得到索引詞集合。
4.根據權利要求3所述的方法,其特征在于,所述根據所述第一排序結果,確定第一采樣概率,包括:
確定所述第一排序結果中的每一排列序號與第一預設調整量的第一差值;
確定每一所述第一差值與第二預設調整量的第一比例;
基于所述第一比例和預設基數,確定所述第一采樣概率。
5.根據權利要求1所述的方法,其特征在于,所述確定所述候選文章集合中每一候選文章與所述畫像信息之間的匹配度,包括:
從所述畫像信息中,確定與所述候選文章相匹配的興趣標簽;
基于所述相匹配的興趣標簽的數量,確定所述候選文章與所述畫像信息之間的匹配度。
6.根據權利要求1所述的方法,其特征在于,所述確定所述候選文章集合中每一候選文章與所述畫像信息之間的匹配度,包括:
確定所述畫像信息中與所述候選文章相匹配的興趣標簽的權重;
基于所述相匹配的興趣標簽的權重,確定所述候選文章與所述畫像信息之間的匹配度。
7.根據權利要求1至6任一項所述的方法,其特征在于,所述根據所述匹配度,對所述候選文章集合進行采樣,得到待推薦的目標文章集合,包括:
對所述候選文章與所述畫像信息之間的匹配度進行排序,得到第二排序結果;
根據所述第二排序結果,確定第二采樣概率;
采用所述第二采樣概率對所述候選文章集合進行采樣,得到所述待推薦的目標文章集合。
8.根據權利要求7所述的方法,其特征在于,所述根據所述第二排序結果,確定第二采樣概率,包括:
確定所述第二排序結果中每一排列序號與第三預設調整量的第二差值;
確定每一所述第二差值與第四預設調整量的第二比例;
基于所述第二比例和預設基數,確定所述第二采樣概率。
9.根據權利要求1至6任一項所述的方法,其特征在于,在所述得到待推薦的目標文章集合之后,所述方法還包括:
按照所述目標文章與所述畫像信息之間的匹配度,對所述目標文章集合中的目標文章進行排序;
根據排序后的目標文章的內容,對排序后的目標文章集合進行篩選,得到篩選后的目標文章集合;
輸出所述篩選后的目標文章集合。
10.根據權利要求9所述的方法,其特征在于,所述根據排序后的目標文章的內容,對排序后的目標文章集合進行篩選,得到篩選后的目標文章集合,包括:
確定排列序號不同的目標文章中內容的相似度;
確定相似度大于相似度閾值的相似目標文章的數量;
如果所述數量不在預設數量范圍內,對所述相似目標文章進行刪減,以使所述相似目標文章的數量在預設數量范圍內,以得到所述篩選后的目標文章集合。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于騰訊科技(北京)有限公司,未經騰訊科技(北京)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201911147597.1/1.html,轉載請聲明來源鉆瓜專利網。





