[發明專利]一種基于學術異構網絡的學者影響力評估方法在審
| 申請號: | 201611242445.6 | 申請日: | 2016-12-29 |
| 公開(公告)號: | CN106778011A | 公開(公告)日: | 2017-05-31 |
| 發明(設計)人: | 孔祥杰;張君;劉鑫童;周金夢;寧兆龍;夏鋒 | 申請(專利權)人: | 大連理工大學 |
| 主分類號: | G06F19/00 | 分類號: | G06F19/00 |
| 代理公司: | 大連理工大學專利中心21200 | 代理人: | 溫福雪,侯明遠 |
| 地址: | 116024 遼*** | 國省代碼: | 遼寧;21 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 學術 網絡 學者 影響力 評估 方法 | ||
1.一種基于學術異構網絡的學者影響力評估方法,其特征在于,步驟如下:
1)通過論文引用網絡以及改進的PageRank算法,計算論文基于時間感知的重要性分值
首先根據真實數據集中某一領域待評估論文的相互引用關系構建論文的有向引文網絡,有向引文網絡中邊的方向從引用論文指向被引用論文;根據每篇論文隨著時間變化在每一年份的平均被引頻次,不斷積累的,是一個逐漸增加的過程這一特點以及論文在單個年份被引用的次數,從平均情況來看,是隨著時間不斷減小這一趨勢,本方法使用加入時間因素的改進PageRank算法計算論文基于時間感知的重要性;
使用如下公式定義一篇論文的已發表年限age:
age=Tc-Tp
其中,Tc為當前的年份,Tp為該論文發表的年份;
基于時間函數的改進PageRank算法公式如下:
其中,PR(pi)表示論文pi的PageRank值,pj表示引用論文pi的文獻,PR(pj)表示論文pj的PageRank值,agei表示論文pi的已發表年限,agej表示論文pj的已發表年限;對待評估論文在發表時間上的重要性做歸一化處理,f(age)是時間函數,且函數的值隨著age增加而減小,f(agei)表示論文pi的時間權重,f(agej)表示論文pj的時間權重,表示待評估論文時間權重的加和;L(pj)為論文pj所引用的所有論文的總數量;d為阻尼系數,同PageRank中一樣,設為0.85;在時間函數上取值越大的論文(即發表年份越近的論文),取得的論文重要性分值越大;論文pi從指向它的論文(引用pi的論文)獲得分值;m是引用論文pi的文獻的總數量;
2)將步驟1)中得到的論文基于時間感知的重要性分值代入論文-學者異構無向網絡,作為論文在該網絡中的初始權值
根據待評估論文和學者信息構建論文-學者異構無向網絡,該網絡中的邊代表學者與其發表的全部論文的對應關系;將步驟1)中得出的基于時間感知的論文重要性分值作為論文-學者異構無向網絡中論文的初始權值進行初始化;將每名學者的初始權值設置為1/n,其中n是全部學者數量;
3)在步驟2)中建立的論文-學者異構無向網絡上,通過論文與學者之間的隨機游走模型計算學者的影響力,由此將論文的影響力作用于學者
隨機游走模型如下:假設論文-學者異構無向網絡中學者的數量為Na,論文的數量為Np;則所有學者初始的分值RW值是相同的,設為1/Na;所有論文初始的分值RW值是相同的,設為1/Np;具體如下:
Step 1:根據如下公式更新學者的RW值:
其中,RW(ai)是學者ai在隨機游走模型中獲得RW值,ps為學者ai所著的任意一篇論文,RW(ps)為其在隨機游走模型中的RW值,C(ps)為ps中所列出的所有作者的人數,可見論文的分值是平均分配給它的所有作者的;d同PageRank中一樣,設為0.85;通過該公式反映出,學者有1-d的概率被隨機訪問,有d的概率通過他所寫的論文被訪問;n是學者ai所著的總論文數;
Step 2:根據如下公式更新論文的分數:
其中,ps為學者ai所著的任意一篇論文,RW(ps)為其在隨機游走模型中的RW值,RW(ai)是學者ai在隨機游走模型中獲得RW值,q是論文ps所列出的所有作者數;d同PageRank中一樣,設為0.85;C(ai)為學者ai所寫的論文的數量;即一個學者的RW值,平均分配給他所寫的所有論文;
Step 3:重復Step 1和Step 2,直到所有學者的RW值和所有論文的RW值均收斂;判斷收斂的標準是,所有學者兩輪迭代得到的不同的RW值的差值的總和小于一個固定的閾值;
通過以上三步,得到所有學者的影響力的值并進行排名。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于大連理工大學,未經大連理工大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201611242445.6/1.html,轉載請聲明來源鉆瓜專利網。
- 同類專利
- 專利分類
G06F 電數字數據處理
G06F19-00 專門適用于特定應用的數字計算或數據處理的設備或方法
G06F19-10 .生物信息學,即計算分子生物學中的遺傳或蛋白質相關的數據處理方法或系統
G06F19-12 ..用于系統生物學的建模或仿真,例如:概率模型或動態模型,遺傳基因管理網絡,蛋白質交互作用網絡或新陳代謝作用網絡
G06F19-14 ..用于發展或進化的,例如:進化的保存區域決定或進化樹結構
G06F19-16 ..用于分子結構的,例如:結構排序,結構或功能關系,蛋白質折疊,結構域拓撲,用結構數據的藥靶,涉及二維或三維結構的
G06F19-18 ..用于功能性基因組學或蛋白質組學的,例如:基因型–表型關聯,不均衡連接,種群遺傳學,結合位置鑒定,變異發生,基因型或染色體組的注釋,蛋白質相互作用或蛋白質核酸的相互作用





