[發明專利]一種基于用戶行為的學術資源推薦方法有效
| 申請號: | 201611128680.0 | 申請日: | 2016-12-09 |
| 公開(公告)號: | CN106802915B | 公開(公告)日: | 2020-07-28 |
| 發明(設計)人: | 劉柏嵩;尹麗玲;王洋洋;高元;費晨杰 | 申請(專利權)人: | 寧波大學 |
| 主分類號: | G06F16/9535 | 分類號: | G06F16/9535;G06F16/332;G06F16/338 |
| 代理公司: | 寧波奧圣專利代理事務所(普通合伙) 33226 | 代理人: | 程曉明 |
| 地址: | 315211 浙*** | 國省代碼: | 浙江;33 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 用戶 行為 學術 資源 推薦 方法 | ||
1.一種基于用戶行為的學術資源推薦方法,其特征在于,包括以下步驟:
①對資源庫中的所有學術資源從資源類型、學科分布、關鍵詞分布和LDA主題分布共四個維度進行建模,得到學術資源模型;
②根據篩選規則,對資源庫中的所有學術資源進行篩選,得到待推薦的學術資源集合;
③從用戶行為日志中獲取用戶的瀏覽記錄,計算用戶對瀏覽過的每條學術資源產生的行為系數;
④基于行為系數與學術資源模型構建用戶興趣模型;
⑤計算學術資源模型和用戶興趣模型之間的相似度,得到待推薦學術資源集合中每條學術資源與用戶興趣模型之間的相似度;
⑥根據相似度,從待推薦學術資源集合中對用戶進行Top-N推薦;
所述的步驟①中對資源庫中的所有學術資源從資源類型、學科分布、關鍵詞分布和LDA主題分布共四個維度進行建模,得到學術資源模型的操作具體包括:
將所述的學術資源模型記為Mr,Mr={Tr,Kr,Ct,Lr},其中,Tr為學科分布向量,由貝葉斯多項式模型訓練得到,所述的學科分布為學術資源在75個學科中的概率分布,其中75個學科為根據教育部公布的89個碩士專業整合后得到;
Kr為關鍵詞分布向量,Kr={(kr1,ωr1),(kr2,ωr2),...,(kri,ωri),...,(krN1,ωrN1)},N1為關鍵詞個數,kri表示單條學術資源第i個關鍵詞,其中1≤i≤N1,ωri為關鍵詞kri的權重,ωri通過改進后的TF-IDF算法計算得到,公式如下:
其中,ωri表示學術資源r中第i個關鍵詞的權重,tf(r,i)表示第i個關鍵詞在學術資源r中出現的頻度,Z表示學術資源總數,l表示包含關鍵詞i的學術資源數量;
Ct為資源類型,t的取值為1,2,3,4,5;
Lr為學術資源的LDA主題分布向量,Lr={lr1,lr2,lr3,...,lrq,...,lrN2},lrq表示學術資源r屬于第q個學科的概率,其中1≤q≤N2,N2為LDA潛在主題數量,Lr由LDA模型訓練得到;
所述的步驟④中基于行為系數與學術資源模型構建用戶興趣模型的操作具體包括:
將所述的用戶興趣模型記為Mu,Mu={Tu,Ku,Ct,Lu},其中,Tu為用戶的學科偏好向量,即
其中,sum為用戶瀏覽過的學術資源總數,Sj為用戶對j產生的行為系數,反映用戶對j的偏好程度,Tjr為j的學科分布向量;
Ku為用戶的關鍵詞偏好向量,首先將行為系數S與關鍵詞分布向量Kr相乘計算出用戶瀏覽過的每篇學術資源新的關鍵詞分布,然后選取所有學術資源新的關鍵詞分布的TOP-N3作為用戶的關鍵詞偏好向量Ku,N3為用戶偏好關鍵詞個數;
Lu為用戶的LDA主題偏好向量,即
其中,Ljr為j的LDA主題分布向量。
2.根據權利要求1所述的一種基于用戶行為的學術資源推薦方法,其特征在于,所述的步驟①中還包括:對資源庫中的所有學術資源計算每條學術資源的權威度、社區熱度和時新度三個特征值,根據這三個特征值計算并得到每條學術資源的質量值。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于寧波大學,未經寧波大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201611128680.0/1.html,轉載請聲明來源鉆瓜專利網。





