[發明專利]一種文章推薦方法、裝置、電子設備及可讀存儲介質在審
| 申請號: | 202110003059.6 | 申請日: | 2021-01-04 |
| 公開(公告)號: | CN112632396A | 公開(公告)日: | 2021-04-09 |
| 發明(設計)人: | 王毅君;徐凱波 | 申請(專利權)人: | 上海明略人工智能(集團)有限公司 |
| 主分類號: | G06F16/9535 | 分類號: | G06F16/9535;G06F40/242;G06F40/289;G06F16/33;G06K9/62 |
| 代理公司: | 北京超成律師事務所 11646 | 代理人: | 孔默 |
| 地址: | 200030 上海市徐匯區*** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 文章 推薦 方法 裝置 電子設備 可讀 存儲 介質 | ||
本申請提供了一種文章推薦方法、裝置、電子設備及可讀存儲介質,所述方法包括:獲取文章池中每篇文章包括的至少部分標題,從獲取到的標題中提取出多個關鍵詞,確定各篇文章對應的關鍵詞向量,根據各篇文章對應的關鍵詞向量,確定文章池中每篇未讀文章與任意一篇已讀文章之間的相似度,針對每篇未讀文章,結合該未讀文章與任意一篇已讀文章之間的相似度以及目標用戶針對每篇已讀文章的評價行為,確定該未讀文章與所有已讀文章之間的匹配度,基于所述匹配度,從所有未讀文章中確定出推薦給目標用戶的目標文章。這樣,可以準確的確定出推薦給目標用戶的目標文章,從而提高為用戶推薦用戶感興趣的文章的準確度。
技術領域
本申請涉及文章推薦技術領域,尤其是涉及一種文章推薦方法、裝置、電子設備及可讀存儲介質。
背景技術
目前,企業通過企業微信向員工個性化地推薦員工感興趣的文章,一方面能夠幫助員工節省大量時間和精力去尋找感興趣的文章,另一方面能夠幫助員工開拓眼界,給公司貢獻更多價值。
對于現有技術方案,通常采用根據文章的轉評贊數量進行加權求和打分,而后按照分值從高到低進行推薦。但是這種方式沒有考慮每個用戶的喜好,這樣,容易造成在對應內容的匹配推薦過程中出現推薦不準確的問題,導致為用戶推薦的內容并不是用戶感興趣的,使得用戶的閱讀體驗不佳。
發明內容
有鑒于此,本申請的目的在于提供一種文章推薦方法、裝置、電子設備及可讀存儲介質,可以準確的確定出推薦給目標用戶的目標文章,從而提高為用戶推薦用戶感興趣的文章的準確度。
第一方面,本申請提供了一種文章推薦方法,所述文章推薦方法包括:
獲取文章池中每篇文章包括的至少部分標題,所述文章池中包括目標用戶已讀文章和未讀文章;
從獲取到的標題中提取出多個關鍵詞,確定各篇文章對應的關鍵詞向量;
根據各篇文章對應的關鍵詞向量,確定文章池中每篇未讀文章與任意一篇已讀文章之間的相似度;
針對每篇未讀文章,結合該未讀文章與任意一篇已讀文章之間的相似度以及目標用戶針對每篇已讀文章的評價行為,確定該未讀文章與所有已讀文章之間的匹配度;
基于每篇未讀文章與所有已讀文章之間的匹配度,從所有未讀文章中確定出推薦給所述目標用戶的目標文章。
優選地,通過以下步驟從獲取到的標題中提取多個關鍵詞:
將獲取到的標題進行分詞處理,得到多個標題詞語;
從所述多個標題詞語中刪除與預設待刪除詞相同的詞語,得到多個關鍵詞,其中,所述預設待刪除詞包括語氣助詞、連詞、結構助詞以及后綴詞。
優選地,通過以下步驟確定各篇文章對應的關鍵詞向量:
基于從文章池中每篇文章的至少部分標題中提取出的多個關鍵詞,統計各篇文章包括的各個關鍵詞的出現次數;
根據各個關鍵詞的出現次數確定各篇文章對應的關鍵詞向量。
優選地,所述根據各篇文章對應的關鍵詞向量,確定文章池中每篇未讀文章與任意一篇已讀文章之間的相似度,包括:
基于每篇未讀文章對應的關鍵詞向量和任意一篇已讀文章對應的關鍵詞向量,計算每篇未讀文章對應的關鍵詞向量與任意一篇已讀文章對應的關鍵詞向量之間的內積,以及每篇未讀文章對應的關鍵詞向量的第一模長和任意一篇已讀文章對應的關鍵詞向量的第二模長;
基于所述內積、所述第一模長和所述第二模長,確定文章池中每篇未讀文章與任意一篇已讀文章之間的相似度。
優選地,所述評價行為包括;針對文章的評論行為、針對文章的點贊行為、針對文章內容的查看行為和針對文章標題的瀏覽行為。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于上海明略人工智能(集團)有限公司,未經上海明略人工智能(集團)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110003059.6/2.html,轉載請聲明來源鉆瓜專利網。





