[發明專利]基于畫像的醫學科普文章推薦方法及系統有效
| 申請號: | 201911076021.0 | 申請日: | 2019-11-06 |
| 公開(公告)號: | CN111078994B | 公開(公告)日: | 2023-04-18 |
| 發明(設計)人: | 李冬;周杰 | 申請(專利權)人: | 珠海健康云科技有限公司 |
| 主分類號: | G06F16/9535 | 分類號: | G06F16/9535;G06F16/9536;G06F16/335;G06F17/18;G06N3/045;G06N3/048;G06N3/098 |
| 代理公司: | 廣州嘉權專利商標事務所有限公司 44205 | 代理人: | 鄭晨鳴 |
| 地址: | 519041 廣東省珠海市*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 畫像 醫學 科普 文章 推薦 方法 系統 | ||
1.一種基于畫像的醫學科普文章推薦方法,其特征在于,包括以下步驟:
S100,通過打點日志記錄客戶端或者服務端的行為日志,所述行為日志的記錄內容包括醫學科普文章相關日志、用戶搜索日志、用戶提問日志及登錄日志;
S200,通過日志隊列對所述行為日志進行數據統計,提取特征數據,處理生成用戶畫像和文章畫像;
S300,接收對醫學科普文章的請求,根據所述的用戶畫像和所述的文章畫像通過機器學習算法生成相應的推薦文件列表。
2.根據權利要求1所述的基于畫像的醫學科普文章推薦方法,其特征在于,所述步驟S200包括:
S210,提取所述行為日志中編輯人員新增修改的文章,通過自然語言處理,分詞、關鍵詞抽取、主體分析及實體詞抽取處理,生成或更新所述文章畫像;
S220,提取所述行為日志中用戶的行為軌跡,包括文章的閱讀、文章的收藏、文章的評論、文章的點贊、搜索記錄、咨詢購買記錄及用戶登錄記錄信息,結合用戶的注冊信息,統計分析用戶偏好的所述文章畫像,生成或更新所述用戶畫像。
3.根據權利要求1所述的基于畫像的醫學科普文章推薦方法,其特征在于,所述步驟S300包括:
S310,接收用戶對醫學科普文章的請求,通過若干個召回策略進行召回,獲得相應的粗選文章集合;
S320,?從所述粗選的文章集合中,按照預設的比例提取排行前列的若干篇文章,合并去重,并根據需要按一定規則進行補充,獲得待選文章集;
S330,通過多個特征維度的模型算法,對所述待選文章集的文件預測點擊率,根據所述點擊率的預測值進行排序推送。
4.根據權利要求3所述的基于畫像的醫學科普文章推薦方法,其特征在于,所述召回策略包括:Tag召回、Word2Vec召回、熱門召回及FP-group召回;所述特征維度的模型算法包括:LR模型算法、XGBoost+LR模型算法、FM模型算法及WideDeep模型算法。
5.根據權利要求3所述的基于畫像的醫學科普文章推薦方法,其特征在于,所述合并去重,包括:從合并后的所述醫學科普文章中,去除重復的所述醫學科普文章及用戶最近看過的所述醫學科普文章。
6.根據權利要求1所述的基于畫像的醫學科普文章推薦方法,其特征在于,所述文章畫像的屬性包括:發布時間,編輯人員,語義標簽、協同特征、熱度、時空屬性及質量屬性;其中,語義標簽包括:文章的類別、主題分布、關鍵詞及實體詞。
7.根據權利要求1所述的基于畫像的醫學科普文章推薦方法,其特征在于,所述用戶畫像的屬性包括:
基礎人口特征信息,包括性別、年齡及地理信息;
行為特征信息,包括關注的科室、文章關鍵字、文章類別分布、文章主題分布、日均閱讀時長、日均閱讀文章數目及月均閱讀文章數目;
文章偏好屬性,根據用戶訪問的文章記錄對應的文章畫像屬性得到。
8.一種基于畫像的醫學科普文章推薦系統,使用權利要求1-7中任一項的方法,其特征在于,包括:
日志處理模塊,用于接收所述行為日志,獲取所述行為日志中記錄的包括醫學科普文章相關日志、用戶搜索日志、用戶提問日志及登錄日志的樣本數據,統計數據,提取特征數據,生成所述的用戶畫像及所述的文章畫像;
文章推薦模塊,用于接收對醫學科普文章的請求,根據所述的用戶畫像和所述的文章畫像,生成相應的推薦文件列表;
數據存儲模塊,用于存儲用戶原始日志,樣本數據,特征數據,畫像數據及報表數據。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于珠海健康云科技有限公司,未經珠海健康云科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201911076021.0/1.html,轉載請聲明來源鉆瓜專利網。





