[發明專利]一種基于協同過濾優化的推薦算法和裝置有效
| 申請號: | 201711375432.0 | 申請日: | 2017-12-19 |
| 公開(公告)號: | CN108228745B | 公開(公告)日: | 2020-09-22 |
| 發明(設計)人: | 陳本庚;劉芳彤;周海漢;陳杰;方勇 | 申請(專利權)人: | 哈勃智遠(北京)科技有限公司 |
| 主分類號: | G06F16/335 | 分類號: | G06F16/335;G06F16/9536 |
| 代理公司: | 北京風雅頌專利代理有限公司 11403 | 代理人: | 王剛 |
| 地址: | 100080 北京市海淀*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 協同 過濾 優化 推薦 算法 裝置 | ||
本發明公開了一種基于協同過濾優化的推薦算法,包括:接收目標用戶的新聞推薦申請,預估目標用戶對未讀基礎新聞文章的第一評分,根據第一評分對未讀基礎新聞文章進行排序,選取預設數量的未讀基礎新聞文章作為一級推薦列表;計算第一推薦列表中的未讀基礎新聞文章與新進新聞文章的相似度,建立第一推薦列表中的未讀基礎新聞文章與新進新聞文章的對應關系;根據一級推薦列表以及對應關系構建候選推薦列表;計算候選推薦列表中各個元素的第二評分,根據第二評分排序生成二級推薦列表并發送給目標用戶。該方法不僅能夠挖掘用戶潛在興趣,還能夠保證新聞的時效性,及時的將用戶感興趣的文章推送給用戶。
技術領域
本發明涉及基于協同過濾的推薦方法領域,特別是指一種基于協同過濾優化的推薦算法和裝置。
背景技術
目前,公知的基于用戶的協同過濾的推薦算法是通過已有的用戶行為數據,在海量的數據中挖掘出小部分與目標用戶品味類似的用戶,使這些用戶成為鄰居,然后根據他們喜歡的東西組織成一個排序后的目錄推薦給目標用戶。然而,新聞的推薦存在及時性問題,需要不斷更新,協同過濾需要經過很長的時間收集用戶點擊日志數據,從而產生推薦。對于一般的新聞推薦系統不能承受訓練數據積累所消耗的時間,容易延誤新聞推薦的時效性。
發明內容
有鑒于此,本發明的目的在于提出一種基于協同過濾優化的推薦算法和裝置,克服了現有的協同過濾算法收集數據時間長的問題,保證新聞推薦的時效性。
基于上述目的本發明提供的一種基于協同過濾優化的推薦算法,應用于基礎新聞庫和新進新聞庫,所述基礎新聞庫包括未讀基礎新聞文章及已讀基礎新聞文章,所述新進新聞庫包括新進新聞文章;所述推薦算法包括:
接收目標用戶的新聞推薦申請,預估所述目標用戶對所述未讀基礎新聞文章的第一評分,根據所述第一評分對所述未讀基礎新聞文章進行排序,選取預設數量的所述未讀基礎新聞文章作為一級推薦列表;
計算所述第一推薦列表中的所述未讀基礎新聞文章與所述新進新聞文章的相似度,建立所述第一推薦列表中的所述未讀基礎新聞文章與所述新進新聞文章的對應關系;
根據所述一級推薦列表以及所述對應關系構建候選推薦列表;
計算所述候選推薦列表中各個元素的第二評分,根據所述第二評分排序生成二級推薦列表并發送給目標用戶。
進一步,在所述預估所述目標用戶對所述未讀基礎新聞文章的第一評分之前,還包括:
對所述未讀基礎新聞文章、所述已讀基礎新聞文章以及所述新進新聞文章進行文章標簽化的自然語言處理,提取關鍵信息。
進一步,所述預估所述目標用戶對所述未讀基礎新聞文章的第一評分,包括:
根據所述關鍵信息,計算所述目標用戶對所述已讀基礎新聞文章的第三評分;
基于所述第三評分采用基于用戶的協同過濾算法,計算所述目標用戶對所述未讀基礎新聞文章的第一評分。
進一步,所述第三評分的計算公式包括:
其中,feature為所述關鍵信息列表,為用戶的行為標簽,為文章的對應標簽;w為列表中各類標簽所占的權重;Loved為用戶收藏該文章的操作,收藏置為1,未收藏置為0;ReadingTime為用戶閱讀該文章的時長,ArticleLenth為文章長度;α1、β1和γ1為各部分對應的計算權重。
進一步,所述相似度的計算公式包括
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于哈勃智遠(北京)科技有限公司,未經哈勃智遠(北京)科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201711375432.0/2.html,轉載請聲明來源鉆瓜專利網。





