[發(fā)明專利]一種基于專家領(lǐng)域相似度與關(guān)聯(lián)關(guān)系的協(xié)同推薦方法有效
| 申請?zhí)枺?/td> | 201811228086.8 | 申請日: | 2018-10-19 |
| 公開(公告)號: | CN109308315B | 公開(公告)日: | 2022-09-16 |
| 發(fā)明(設(shè)計)人: | 李千目;陳盛之;劉奕婧 | 申請(專利權(quán))人: | 南京理工大學(xué) |
| 主分類號: | G06F16/33 | 分類號: | G06F16/33 |
| 代理公司: | 南京理工大學(xué)專利中心 32203 | 代理人: | 薛云燕 |
| 地址: | 210094 江*** | 國省代碼: | 江蘇;32 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 專家 領(lǐng)域 相似 關(guān)聯(lián) 關(guān)系 協(xié)同 推薦 方法 | ||
1.一種基于專家領(lǐng)域相似度與關(guān)聯(lián)關(guān)系的協(xié)同推薦方法,其特征在于,包括以下步驟:
步驟1,將批量論文數(shù)據(jù)作為訓(xùn)練集進(jìn)行輸入;
步驟2,對論文數(shù)據(jù)進(jìn)行預(yù)處理,包括提取專家合作信息、專家論文關(guān)鍵詞、專家論文摘要;對同一篇論文下的合作者建立專家合作信息;
步驟3,將目標(biāo)專家姓名、目標(biāo)領(lǐng)域作為輸入,獲取領(lǐng)域詞向量;
步驟4,利用專家合作信息構(gòu)造合作關(guān)系網(wǎng)絡(luò),利用Dijkstra算法計算作者之間的最短路徑,作為專家關(guān)聯(lián)度COR;
步驟5,利用word2vec訓(xùn)練專家論文中的關(guān)鍵詞和摘要,構(gòu)建專家關(guān)鍵詞向量模型;
步驟6,計算專家關(guān)鍵詞向量與領(lǐng)域詞向量的余弦相似度,作為專家領(lǐng)域相似度SIM;
步驟7,篩選專家領(lǐng)域相似度SIM與專家關(guān)聯(lián)度COR,滿足閾值的專家即為推薦專家。
2.根據(jù)權(quán)利要求1所述的基于專家領(lǐng)域相似度與關(guān)聯(lián)關(guān)系的協(xié)同推薦方法,其特征在于,步驟4所述的利用專家合作信息構(gòu)造合作關(guān)系網(wǎng)絡(luò),利用Dijkstra算法計算作者之間的最短路徑,作為專家關(guān)聯(lián)度COR,具體如下:
步驟4.1、根據(jù)論文作者列表信息,以作者作為節(jié)點,將共同撰寫論文的作者用邊連接起來,共同撰寫論文數(shù)的倒數(shù)作為邊的權(quán)重,構(gòu)造專家合作信息無向加權(quán)圖G=(V,E);
步驟4.2、利用Dijkstra算法計算作者之間的最短路徑,作為專家關(guān)聯(lián)度COR,具體步驟如下:
步驟4.2.1、輸入專家合作信息無向加權(quán)圖G=(V,E),輸入目標(biāo)專家姓名作為源點v0;
步驟4.2.2、用鄰接矩陣arcs表示無向加權(quán)圖,arcs[m][n]表示邊vm,vn的權(quán)值,若不存在邊vm,vn,則arcs[m][n]=∞,其中m,n∈{m,n|vm,vn∈V};
步驟4.2.3、設(shè)置集合S記錄已求得最短路徑的頂點,令集合S初始為{v0};
步驟4.2.4、設(shè)置數(shù)組dist[]記錄從源點v0到其他各個頂點vi的當(dāng)前最短路徑長度,dist[i]初始值為arcs[0][i],其中i∈{i|vi∈V};
步驟4.2.5、從頂點集合V-S中選出vj,滿足dist[j]=Min{dist[i]|vi∈V-S},vj就是當(dāng)前求得的一條從v0出發(fā)的最短路徑的終點;令集合S=S∪{vj};
步驟4.2.6、修改從源點v0到集合V-S中各個頂點vk的最短路徑長度:如果dist[j]+arcs[j][k]<dist[k],則令dist[k]=dist[j]+arcs[j][k];
步驟4.2.7、重復(fù)步驟4.2.5和步驟4.2.6至集合V-S為空集;
步驟4.2.8、輸出數(shù)組dist[],其中vi對應(yīng)專家與v0對應(yīng)目標(biāo)專家的專家關(guān)聯(lián)度COR(i)=dist[i]。
3.根據(jù)權(quán)利要求1所述的基于專家領(lǐng)域相似度與關(guān)聯(lián)關(guān)系的協(xié)同推薦方法,其特征在于,步驟6所述的計算專家關(guān)鍵詞向量與領(lǐng)域詞向量的余弦相似度,作為專家領(lǐng)域相似度SIM,具體如下:
步驟6.1、輸入由步驟5生成的專家關(guān)鍵詞向量模型;
步驟6.2、輸入專家關(guān)鍵詞集X={x1,x2,...,xm},以及關(guān)鍵詞權(quán)重集w={w1,w2,...,wm};
步驟6.3、利用專家關(guān)鍵詞向量模型計算專家關(guān)鍵詞向量集合
步驟6.4、計算專家關(guān)鍵詞向量
步驟6.5、輸入目標(biāo)領(lǐng)域關(guān)鍵詞,計算目標(biāo)領(lǐng)域詞向量
步驟6.6、計算專家領(lǐng)域相似度
4.根據(jù)權(quán)利要求1所述的基于專家領(lǐng)域相似度與關(guān)聯(lián)關(guān)系的協(xié)同推薦方法,其特征在于,步驟7所述的篩選專家領(lǐng)域相似度SIM與專家關(guān)聯(lián)度COR,滿足閾值的專家即為推薦專家,具體如下:
依據(jù)用戶給定的專家關(guān)聯(lián)度閾值c與領(lǐng)域相似度閾值s,輸出滿足SIM>s且COR<c的專家信息。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于南京理工大學(xué),未經(jīng)南京理工大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811228086.8/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





