[發明專利]基于主題的個性化研究方向推薦系統和推薦方法有效
| 申請號: | 201310396246.0 | 申請日: | 2013-09-04 |
| 公開(公告)號: | CN103425799A | 公開(公告)日: | 2013-12-04 |
| 發明(設計)人: | 盧美蓮;高潔;王萌星;秦臻;劉智超 | 申請(專利權)人: | 北京郵電大學 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 北京德琦知識產權代理有限公司 11018 | 代理人: | 夏憲富 |
| 地址: | 100876 *** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 主題 個性化 研究 方向 推薦 系統 方法 | ||
技術領域
本發明涉及一種個性化研究方向推薦系統和推薦方法,確切的說,涉及一種針對用戶行為進行基于主題的個性化研究方向推薦系統和推薦方法,屬于數據挖掘和機器學習的技術領域。
背景技術
目前,隨著互聯網的快速發展,人們正處于一個信息爆炸的時代。面對現階段的海量信息,如何實現信息的篩選和過濾成為衡量一個網絡系統性能好壞的重要指標。每個具有良好用戶體驗的網絡系統,都會對海量信息進行篩選與過濾,將用戶最關注、最感興趣的信息展現在用戶面前。這樣既大大增加了網絡系統的工作效率和效果,也顯著節省了用戶自己篩選信息的時間。
搜索引擎的出現,在一定程度上解決了信息篩選問題,但是還遠遠不夠。因為搜索引擎需要用戶主動提供關鍵詞,以此作為其對海量信息進行篩選的依據。當用戶無法準確描述自己的需求時,搜索引擎的篩選效果就將大打折扣。然而,用戶將自己的需求和意圖轉化成關鍵詞的過程,其本身就是一個并不輕松的處理操作過程。故在此背景下,人們研制了推薦系統:其任務就是解決上述將用戶和信息進行關聯的問題:一方面幫助用戶發現對自己有價值的信息,另一方面讓信息能展現在對其感興趣的人群中,從而實現信息提供商與用戶的雙贏。
在學術領域,每年發表有大量的論文、專利和會議集,根據中國科學技術信息研究所2011年底發布的統計數據,2010年美國發表SCI論文39.01萬篇,排在世界第一位,中國發表SCI論文14.84萬篇(含港澳地區),排在第二位。面對數量如此之多的學術論文,用戶需要花費大量的時間才能找到自己所需要的信息。這種瀏覽大量無關信息的過程,無疑會使淹沒在信息過載問題中的大量用戶不斷流失。在這種背景下,個性化學術推薦系統應運而生。個性化學術推薦系統是一個依據用戶的行為等信息挖掘用戶感興趣的資源,并推薦給用戶的網絡系統。該系統采用用戶與學術網站進行交互,學術網站通過分析用戶的行為等信息,挖掘出用戶感興趣的學術資源,并自動推薦給用戶,實現學術網站與用戶的雙贏。目前,應用較多的個性化學術推薦方法包括:
第一種是協同過濾的學術資源推薦算法,它又包含下述兩種方法:
一是基于用戶的協同過濾方法:其基本思想相當簡單,基于用戶對學術資源的偏好尋找其相似的鄰居用戶,然后將鄰居用戶喜歡的內容推薦給當前用戶。其操作步驟為:
步驟1、先將一個用戶對所有學術資源的偏好作為一個向量,用于計算用戶之間的相似度,找到K鄰居;
步驟2、根據鄰居的相似度權重及其對學術資源的偏好,預測當前用戶沒有偏好或未涉及的學術資源,計算得到一個排序的學術資源列表作為推薦。
二是基于項目的協同過濾方法:其工作原理和基于用戶的協同過濾方法類似,只是在計算其鄰居時,采用學術資源本身,而不是從用戶的角度,即基于用戶對學術資源的偏好找到相似的學術資源,然后根據用戶的歷史偏好,向其推薦相似的學術資源。其操作步驟為:
步驟1,先將所有用戶對某個學術資源的偏好作為一個向量,計算各個學術資源之間的相似度,得到每個學術資源的相似學術資源;
步驟2,根據用戶的歷史偏好,預測當前用戶還沒有表示偏好的學術資源,計算得到一個排序的學術資源列表作為推薦。
協同過濾的優點是:能夠過濾難以進行內容分析的信息,如藝術品,音樂等。可以共享其他人的經驗,還避免了內容分析的不完全和不精確,并且能夠基于一些復雜的、難以描述的抽象概念(如信息質量、個人品味)進行過濾。具有推薦新信息的功能,可以發現內容上完全不相似的信息,且用戶對推薦的內容也是其事先所沒有預料到的。
雖然協同過濾作為一種典型的推薦技術有著很好的應用,但是,其也仍然存在許多問題有待解決。最典型的是:稀疏問題(Sparsity)和可擴展問題(Scalability)。
第二種是基于內容的學術用戶推薦算法,其核心思想是根據學術資源內容的元數據,發現學術資源內容的相關性,然后基于用戶以往的喜好記錄,向用戶推薦相似的學術資源。其操作步驟為:
步驟1、根據學術資源的內容,并結合用戶的行為數據對用戶進行建模;
步驟2、通過計算學術資源與目標用戶之間的相似度,將相似度排名較高的學術資源推薦給目標用戶。
基于內容的推薦方法能夠很好地對用戶的喜好進行建模,以便提供更精準的推薦。同時,由于推薦是根據學術資源的內容進行計算的,因此,不存在數據稀疏和冷啟動問題,并且具有很好的可解釋性。
綜上所述,現在的學術推薦系統與推薦方法依然存在下述兩個主要問題:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京郵電大學,未經北京郵電大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201310396246.0/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:奶牛子宮用藥栓劑的制備模具
- 下一篇:壓力機平衡缸





