[發明專利]一種基于專家領域相似度與關聯關系的協同推薦方法有效
| 申請號: | 201811228086.8 | 申請日: | 2018-10-19 |
| 公開(公告)號: | CN109308315B | 公開(公告)日: | 2022-09-16 |
| 發明(設計)人: | 李千目;陳盛之;劉奕婧 | 申請(專利權)人: | 南京理工大學 |
| 主分類號: | G06F16/33 | 分類號: | G06F16/33 |
| 代理公司: | 南京理工大學專利中心 32203 | 代理人: | 薛云燕 |
| 地址: | 210094 江*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 專家 領域 相似 關聯 關系 協同 推薦 方法 | ||
本發明公開了一種基于專家領域相似度與關聯關系的協同推薦方法。該方法為:將論文文獻數據作為訓練集進行輸入;對同一篇論文下的合作者建立關聯關系,構造合作關系網絡,利用Dijkstra算法計算作者之間的最短路徑,作為專家關聯度;利用word2vec算法訓練專家論文中的關鍵詞與摘要,構造專家詞向量模型,利用向量間的夾角作為專家領域相似度;融合專家關聯度與領域相似度,構造協同推薦模型,使用協同推薦模型進行專家推薦。本發明方法能夠依據用戶給定領域關鍵詞與專家姓名,推薦與該專家關聯度最緊密的指定領域專家,從而快速找到與自身存在潛在合作價值的期望領域的專家。
技術領域
本發明涉協同推薦技術領域,特別是一種基于專家領域相似度與關聯關系的協同推薦方法。
背景技術
競爭與合作是二十一世紀的主題,科研領域中存在著許多跨領域的合作,合作往往以論文的形式體現。專家在尋找合作的過程中往往希望找到特定領域,且與自己關系密切的專家學者進行合作,這樣既可以達到合作的目的,也更加的便捷。如何快速的找到與自身存在潛在合作價值的期望領域的專家,是進行良好合作的基礎。因此,專家推薦得到了各領域專家的廣泛關注。
目前關于專家推薦的研究主要分為兩類,一類是基于內容的推薦,該方法主要借助向量空間模型、語言模型和主題模型等自然語言處理技術計算專家研究主題與當前需求的匹配度。另一類是基于鏈接關系的推薦方法,此方法主要利用學術網絡的連接結構來推斷專家的學術影響力。傳統專家推薦方法雖然結合了研究內容相關性與專家影響力這兩個方面,卻沒有考慮到專家之間存在的潛在的關聯關系,因此難以快速、全面、準確地推薦與該專家緊密關聯的指定領域專家。
發明內容
本發明的目的在于提供一種基于專家領域相似度與關聯關系的協同推薦方法,能夠依據用戶給定領域關鍵詞與專家姓名,推薦與該專家關聯度最緊密的指定領域專家。
實現本發明目的的技術解決方案為:一種基于專家領域相似度與關聯關系的協同推薦方法,包括以下步驟:
步驟1,將批量論文數據作為訓練集進行輸入;
步驟2,對論文數據進行預處理,包括提取專家合作信息、專家論文關鍵詞、專家論文摘要;對同一篇論文下的合作者建立專家合作信息;
步驟3,將目標專家姓名、目標領域作為輸入,獲取領域詞向量;
步驟4,利用專家合作信息構造合作關系網絡,利用Dijkstra算法計算作者之間的最短路徑,作為專家關聯度COR;
步驟5,利用word2vec訓練專家論文中的關鍵詞和摘要,構建專家關鍵詞向量模型;
步驟6,計算關聯專家詞向量與領域詞向量的余弦相似度,作為專家領域相似度SIM;
步驟7,篩選專家領域相似度SIM與專家關聯度COR,滿足閾值的專家即為推薦專家。
進一步地,步驟4所述的利用專家合作信息構造合作關系網絡,利用Dijkstra算法計算作者之間的最短路徑,作為專家關聯度COR,具體如下:
步驟4.1、根據論文作者列表信息,以作者作為節點,將共同撰寫論文的作者用邊連接起來,共同撰寫論文數的倒數作為邊的權重,構造專家合作信息無向加權圖G=(V,E);
步驟4.2、利用Dijkstra算法計算作者之間的最短路徑,作為專家關聯度COR,具體步驟如下:
步驟4.2.1、輸入專家合作信息無向加權圖G=(V,E),輸入目標專家姓名作為源點v0;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于南京理工大學,未經南京理工大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811228086.8/2.html,轉載請聲明來源鉆瓜專利網。





