[發(fā)明專(zhuān)利]一種基于多相似度融合的科研合作者推薦方法在審
| 申請(qǐng)?zhí)枺?/td> | 202210003383.2 | 申請(qǐng)日: | 2022-01-04 |
| 公開(kāi)(公告)號(hào): | CN114385927A | 公開(kāi)(公告)日: | 2022-04-22 |
| 發(fā)明(設(shè)計(jì))人: | 萬(wàn)良田;吳海南;孫璐;孔祥杰 | 申請(qǐng)(專(zhuān)利權(quán))人: | 大連理工大學(xué) |
| 主分類(lèi)號(hào): | G06F16/9536 | 分類(lèi)號(hào): | G06F16/9536;G06F40/232;G06F40/289;G06K9/62;G06Q50/00 |
| 代理公司: | 遼寧鴻文知識(shí)產(chǎn)權(quán)代理有限公司 21102 | 代理人: | 苗青 |
| 地址: | 116024 遼*** | 國(guó)省代碼: | 遼寧;21 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 多相 融合 科研 合作者 推薦 方法 | ||
1.一種基于多相似度融合的科研合作者推薦方法,其特征在于,步驟如下:
步驟1:對(duì)DBLP引文網(wǎng)絡(luò)數(shù)據(jù)集進(jìn)行預(yù)處理,構(gòu)建學(xué)術(shù)合作網(wǎng)絡(luò),節(jié)點(diǎn)代表學(xué)者,有合作關(guān)系的學(xué)者之間用邊相連;
步驟2:計(jì)算學(xué)者間的合作關(guān)系相似度,計(jì)算公式如下:
其中,和分別代表學(xué)者am和an發(fā)表論文的總數(shù)量,是論文pi的發(fā)表年份,是兩名學(xué)者第一篇合著論文的發(fā)表年份,tc是當(dāng)前的年份;是兩名學(xué)者合著論文的總數(shù)量;
步驟3:使用Doc2vec模型計(jì)算學(xué)者之間論文摘要的內(nèi)容相似度,從而得到學(xué)者間的研究領(lǐng)域相似度;
步驟4:計(jì)算學(xué)者間的學(xué)術(shù)水平相似度;利用余弦相似度來(lái)計(jì)算兩個(gè)學(xué)者學(xué)術(shù)水平特征向量之間的相似性,計(jì)算公式如下:
其中,Lm和Ln分別為學(xué)者am和an的學(xué)術(shù)水平特征向量;
步驟5:將合作關(guān)系相似度、研究領(lǐng)域相似度以及學(xué)術(shù)水平相似度三個(gè)維度進(jìn)行線性組合,作為學(xué)術(shù)合作網(wǎng)絡(luò)中邊的權(quán)重,其公式如下:
W(am,an)=α×C(am,an)+β×R(am,an)+γ×A(am,an)
其中,C(am,an)表示兩個(gè)科研工作者和之間的合作關(guān)系相似度,R(am,an)表示兩個(gè)科研工作者之間的研究領(lǐng)域相似度,A(am,an)表示科研工作者之間的學(xué)術(shù)水平相似度,α、β、γ為權(quán)重參數(shù),且α+β+γ=1;
步驟6:將待推薦的學(xué)者作為目標(biāo)節(jié)點(diǎn),在學(xué)術(shù)網(wǎng)絡(luò)上進(jìn)行隨機(jī)游走,直至各個(gè)節(jié)點(diǎn)的分?jǐn)?shù)趨于穩(wěn)定狀態(tài),將所有的分值進(jìn)行降序排序,然后取TOPN的學(xué)者推薦給目標(biāo)學(xué)者。
2.根據(jù)權(quán)利要求1所述的一種基于多相似度融合的科研合作者推薦方法,其特征在于,步驟3具體包括以下步驟:
3.1)對(duì)論文摘要構(gòu)成的語(yǔ)料庫(kù)進(jìn)行數(shù)據(jù)預(yù)處理,包括大小寫(xiě)轉(zhuǎn)換、拼寫(xiě)錯(cuò)誤檢查、去停用詞,最后保存在文本文件之中,之后將處理后的所有文檔數(shù)據(jù)帶入Doc2vec模型進(jìn)行訓(xùn)練,最后利用訓(xùn)練好的Doc2vec模型,把每篇摘要轉(zhuǎn)換成向量形式;
3.2)計(jì)算論文摘要的內(nèi)容相似度,計(jì)算公式如下:
其中,pi和pj為兩篇論文摘要所對(duì)應(yīng)的向量表示形式;
3.3)計(jì)算學(xué)者間的研究領(lǐng)域相似度,計(jì)算公式如下:
其中,和分別表示學(xué)者am和an發(fā)表論文的總數(shù),similarity(pi,pj)為論文pi和pj摘要之間的內(nèi)容相似度。
3.根據(jù)權(quán)利要求1或2所述的一種基于多相似度融合的科研合作者推薦方法,其特征在于,步驟4中將學(xué)者的學(xué)術(shù)年齡、h-index、發(fā)表論文的數(shù)量、總被引次數(shù)和合作者數(shù)量五個(gè)指標(biāo)組合作為學(xué)者的學(xué)術(shù)水平特征向量。
4.根據(jù)權(quán)利要求1或2所述的一種基于多相似度融合的科研合作者推薦方法,其特征在于,步驟6中根據(jù)改進(jìn)的重啟型隨機(jī)游走模型為目標(biāo)學(xué)者推薦合作者,具體包括以下步驟:
6.1)計(jì)算節(jié)點(diǎn)之間的轉(zhuǎn)移概率,從節(jié)點(diǎn)e到節(jié)點(diǎn)f的轉(zhuǎn)移概率計(jì)算公式如下:
其中,we,f為節(jié)點(diǎn)e和節(jié)點(diǎn)f之間邊的權(quán)重,N(Pe)為節(jié)點(diǎn)e的鄰居節(jié)點(diǎn)集合;
6.2)計(jì)算網(wǎng)絡(luò)中各節(jié)點(diǎn)的分?jǐn)?shù),計(jì)算公式如下:
其中,AR(pe)是節(jié)點(diǎn)pe對(duì)應(yīng)的分?jǐn)?shù),N是網(wǎng)絡(luò)中所有節(jié)點(diǎn)的個(gè)數(shù),α為阻尼因子,M(pe)表示節(jié)點(diǎn)pe的所有鄰居節(jié)點(diǎn)的集合,Se,f是從節(jié)點(diǎn)e到節(jié)點(diǎn)f的轉(zhuǎn)移概率;
6.3)對(duì)節(jié)點(diǎn)的分值進(jìn)行迭代更新,直至各節(jié)點(diǎn)的分值趨于穩(wěn)定狀態(tài),迭代公式如下:
AR(t+1)=αS·AR(t)+(1-α)q
其中,AR(t)表示迭代到第t步時(shí)圖中各節(jié)點(diǎn)的分?jǐn)?shù)向量,表示在第t步時(shí)節(jié)點(diǎn)e的分?jǐn)?shù)值,q代表重啟向量,目標(biāo)節(jié)點(diǎn)的值為1,其他節(jié)點(diǎn)設(shè)為0,初始狀態(tài)下,AR(0)=q,S為轉(zhuǎn)移概率矩陣。
該專(zhuān)利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專(zhuān)利權(quán)人授權(quán)。該專(zhuān)利全部權(quán)利屬于大連理工大學(xué),未經(jīng)大連理工大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買(mǎi)此專(zhuān)利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202210003383.2/1.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專(zhuān)利網(wǎng)。
- 科研信息演化的分析方法和裝置
- 一種科研用商品智能搜索方法和系統(tǒng)
- 一種科研用商品銷(xiāo)售平臺(tái)的信息推送方法和設(shè)備
- 一種科研管理裝置
- 一種基于實(shí)驗(yàn)最大可重復(fù)性的科研協(xié)作系統(tǒng)
- 一種實(shí)驗(yàn)儀器共享服務(wù)平臺(tái)
- 一種科研績(jī)效考評(píng)系統(tǒng)
- 基于科研能力數(shù)據(jù)的科研項(xiàng)目申報(bào)智能匹配推送方法
- 一種科研人員合作社區(qū)的構(gòu)建方法及裝置
- 面向煙草領(lǐng)域科研人員的多維度畫(huà)像構(gòu)建方法及推薦方法





