[發明專利]基于畫像的醫學科普文章推薦方法及系統有效
| 申請號: | 201911076021.0 | 申請日: | 2019-11-06 |
| 公開(公告)號: | CN111078994B | 公開(公告)日: | 2023-04-18 |
| 發明(設計)人: | 李冬;周杰 | 申請(專利權)人: | 珠海健康云科技有限公司 |
| 主分類號: | G06F16/9535 | 分類號: | G06F16/9535;G06F16/9536;G06F16/335;G06F17/18;G06N3/045;G06N3/048;G06N3/098 |
| 代理公司: | 廣州嘉權專利商標事務所有限公司 44205 | 代理人: | 鄭晨鳴 |
| 地址: | 519041 廣東省珠海市*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 畫像 醫學 科普 文章 推薦 方法 系統 | ||
本發明公開了一種基于畫像的醫學科普文章推薦方法及系統,該方法包括以下步驟:通過日志打點記錄客戶端或者服務端的行為日志,所述行為日志的記錄內容包括醫學科普文章相關日志、用戶搜索日志、用戶提問日志及登錄日志;日志隊列對所述行為日志進行數據統計,提取特征數據,處理生成用戶畫像和文章畫像;接收對醫學科普文章的請求,根據所述的用戶畫像和所述的文章畫像通過機器學習算法生成相應的推薦文件列表。本發明的實施例至少有如下有益效果:通過對于用戶操作行為的分析,對后續的文章推送內容進行持續性優化,提高推送的速度與質量,提升文章的點擊率,滿足用戶對信息的需求。
技術領域
本發明涉及互聯網文章推薦技術領域,特別涉及一種基于畫像的醫學科普文章推薦方法及系統。
背景技術
互聯網的出現和普及給用戶帶來了大量的信息,滿足了用戶在信息時代對于信息的需求,但隨著快速發展的網絡,信息量也隨著大幅增長,使得用戶面對海量信息時無法從中獲取對自己真正有用的信息。
在醫學科普文章領域,存在著用戶體量巨大,偏好差異大,現有的推薦系統多采用協同過濾算法,很難查找到偏好相似的用戶,也就難以進而獲取相關醫學科普文件的推薦列表。
發明內容
本發明旨在至少解決現有技術中存在的技術問題之一。為此,本發明提出一種基于畫像的醫學科普文章推薦方法,能夠較為準確地找到用戶偏好的醫學科普文件。
根據本發明的第一方面實施例的基于畫像的醫學科普文章推薦方法,包括以下步驟:S100,通過打點日志記錄客戶端或者服務端的行為日志,所述行為日志的記錄內容包括醫學科普文章相關日志、用戶搜索日志、用戶提問日志及登錄日志;S200,通過日志隊列對所述用戶行為日志進行數據統計,提取特征數據,處理生成用戶畫像和文章畫像;S300,接收對醫學科普文章的請求,根據所述的用戶畫像和所述的文章畫像通過機器學習算法生成相應的推薦文件列表。
根據本發明實施例的基于畫像的醫學科普文章推薦方法,至少具有如下有益效果:通過對于用戶操作行為的分析,對后續的文章推送內容進行優化,可以提升文章的點擊率,滿足用戶對信息的需求,提高用戶粘著度;兩方面畫像特征數據的建立,可以建立用戶特征與文章特征間的聯系,提高信息檢出的速度與質量;機器學習算法有利于根據用戶行為持續性優化推送內容。
根據本發明的一些實施例,所述步驟S200包括:S210,提取所述行為日志中編輯人員新增修改的文章,通過自然語言處理,分詞、關鍵詞抽取、主體分析及實體詞抽取處理,生成或更新所述文章畫像;S220,提取所述用戶行為日志中用戶的行為軌跡,包括文章的閱讀、文章的收藏、文章的評論、文章的點贊、搜索記錄、咨詢購買記錄及用戶登錄記錄信息,結合用戶的注冊信息,統計分析用戶偏好的所述文章畫像,生成或更新所述用戶畫像。從醫學科普文章的作者與讀者兩方面入手,多方面提取特征數據并更新特征數據,更好地提高文章推送的精準度。
根據本發明的一些實施例,所述步驟S300包括:S310,接收用戶對醫學科普文章的請求,通過若干個召回策略進行召回,獲得相應的粗選的文章集合;S320,從所述粗選的文章集合中,按照預設的比例提取排行前列的若干篇文章,合并去重,并根據需要按一定規則進行補充,獲得待選文章集;S330,,通過多個特征維度的模型算法,對所述待選文章集的文件來預測點擊率,根據所述點擊率的預測值進行排序推送。多召回策略,更好地保證能獲取粗選結果;合并去重補充,優化推送文章內容,確定一定有推送內容;多維度對預測點擊率進行評估,獲得更好的推送效果。
根據本發明的一些實施例,所述召回策略包括:Tag召回、Word2Vec召回、熱門召回及FP-group召回;所述特征維度包括:LR模型算法、XGBoost+LR模型算法、FM模型算法及WideDeep模型算法。多角度通過召回策略可以獲取較多的粗粒度篩選文件;多特征維度對文件的預測點擊率進行評估,更為合理,精細地對文件排序進行推送,獲得較優的推送效果,進而增加用戶的粘著度。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于珠海健康云科技有限公司,未經珠海健康云科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201911076021.0/2.html,轉載請聲明來源鉆瓜專利網。





