[發明專利]一種基于異構信息網絡的科研合作關系預測方法有效
| 申請號: | 201910832856.8 | 申請日: | 2019-09-04 |
| 公開(公告)號: | CN110533253B | 公開(公告)日: | 2021-05-25 |
| 發明(設計)人: | 陳志立;楊晴;葉凡;仲紅 | 申請(專利權)人: | 安徽大學 |
| 主分類號: | G06Q10/04 | 分類號: | G06Q10/04;G06F40/205;G06N3/04 |
| 代理公司: | 安徽省合肥新安專利代理有限責任公司 34101 | 代理人: | 陸麗莉;何梅生 |
| 地址: | 230601 安*** | 國省代碼: | 安徽;34 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 信息網絡 科研 合作關系 預測 方法 | ||
1.一種基于異構信息網絡的科研合作關系預測方法,其特征是按如下步驟進行:
步驟1、科技文獻異構網絡轉化為作者-作者同構網絡:
步驟1.1、構建所述科技文獻異構網絡G=(V,E);其中,V表示所述科技文獻異構網絡中的節點集合,所述節點集合的類型包括作者節點集、論文節點集、會議節點集和術語節點集;所述作者節點集記為A={A1,A2,...,Ai,...,Aa},Ai表示第i個作者節點,1≤i≤a;所述論文節點集記為P={P1,P2,...Pw,...Pp},Pw表示第w個論文節點,1≤w≤p;所述會議節點集記為C={C1,C2,...Cn,...Cc},Cn表示第n個會議節點,1≤n≤c;所述術語節點集記為D={D1,D2,...Dr,...Dd},Dr表示第r個術語節點,1≤r≤d;E表示節點之間的關系所形成的邊集合,包括作者-論文的撰寫關系、會議-論文的發表關系、論文-術語的提及關系、論文-論文的引用關系以及論文-作者的被撰寫關系、論文-會議的被發表關系、術語-論文的被提及關系;
步驟1.2、遍歷所述科技文獻異構網絡中的節點集合V,從而獲取元路徑集Y=(Y1,Y2,...,Yj,...,YL),其中,Yj表示第j條元路徑,且Yj=(Yj1,Yj2,...,Yjg,...,Yjy),Yjg表示第j條元路徑Yj上的第g個節點,1≤g≤y;1≤j≤L;
步驟1.2.1、初始化j=1;
步驟1.2.2、定義變量τ,并初始化τ=1;
步驟1.2.3、在所述科技文獻異構網絡G中將未被訪問的第i個作者節點Ai作為當前第τ個訪問節點并加入到第j條元路徑Yj中,并設置當前第j條元路徑Yj的節點個數countj=1;
步驟1.2.4、隨機選擇當前第τ個訪問節點的鄰接節點作為第τ+1個訪問節點并加入到第j條元路徑Yj中,并將countj的值加1;
步驟1.2.5、判斷countj<Wmax是否成立,若成立,將τ+1賦值給τ后,重復步驟1.2.4,否則,執行步驟1.2.6;其中,Wmax表示所設定的閾值;
步驟1.2.6、生成第j條元路徑Yj:
步驟1.2.6.1、定義變量β,并初始化β=0;
步驟1.2.6.2、判斷第j條元路徑Yj上第Wmax-β個節點是否存在于作者節點集A中,若存在,則生成第j條元路徑Yj,執行步驟1.2.7;否則,刪除第Wmax-β個節點
步驟1.2.6.3、將β+1賦值給β,返回步驟1.2.6.2;
步驟1.2.7、將j+1賦值給j后,判斷j≤L是否成立,若成立,則返回步驟1.2.2執行,否則,生成元路徑集Y;
步驟1.3、生成作者-作者同構網絡:
步驟1.3.1、根據所述元路徑集Y,得到元路徑類型的集合為S={S1,...Sq,...Ss},其中,Sq表示第q個類型的元路徑,且表示第q個類型的元路徑Sq中第ψ個類型的節點集;且表示第q個類型的元路徑Sq中第ψ個節點集中的第μ個節點,1≤μ≤η;表示第q個類型的元路徑Sq中第ψ-1個節點集中的第φ個節點,1≤q≤s;
判斷第q個類型的元路徑Sq是否對稱,且第q個類型的元路徑Sq中的節點個數是否為奇數,若是,則執行步驟1.3.2,否則,執行步驟1.3.3;
步驟1.3.2、將第q個類型的元路徑Sq分解為兩個等長的子元路徑和其中,表示第q個類型的元路徑Sq的中間節點集;
令m(ψ-1)ψ表示第μ個節點與第φ個節點是否存在連邊,若存在,則令m(ψ-1)ψ=1,否則,令m(ψ-1)ψ=0,從而構造表示科技文獻異構網絡G中的節點集與節點集的鄰接矩陣Mψ-1,ψ,則第一個子元路徑Sq1的交換矩陣表示為Mq1=MA,1×M1,2×...×Me-1,e,第二個子元路徑Sq2的交換矩陣表示為Mq2=Me,e+1×Me+1,e+2×....×Mu,A;
利用式(1)生成第q個類型的元路徑Sq的作者-作者矩陣Mq:
式(1)中,為第一個子元路徑Sq1的交換矩陣Mq1歸一化后的矩陣,為第二個子元路徑Sq2的交換矩陣Mq2歸一化后的矩陣;
步驟1.3.3、在第q個類型的元路徑Sq中增加與第e個類型的節點集Qe和第e+1個類型的節點集Qe+1都存在連接的一個類型的節點集Fq,從而生成更新后的第q個類型的元路徑
將更新后的第q個類型的元路徑分解為兩個等長的子元路徑和則第一個更新后的子元路徑的交換矩陣表示為第二個更新后的子元路徑的交換矩陣表示為
利用式(2)生成更新后的第q種類型的元路徑的作者-作者矩陣
式(2)中,為交換矩陣歸一化后的矩陣,為交換矩陣歸一化后的矩陣;
步驟1.3.4、利用式(3)生成元路徑類型集S的作者-作者矩陣M:
式(3)中,表示由第q種類型的元路徑Sq或更新后的第q種類型的元路徑生成的作者-作者矩陣Mq或λq表示第q種類型的元路徑Sq或的權重,且
步驟1.3.5、利用作者-作者矩陣M構建作者-作者同構網絡G′=(A,ε);其中,ε表示作者節點集A中各個作者節點之間的邊;
步驟2、對作者-作者同構網絡G′中的作者節點進行向量表示:
步驟2.1、令Xiu表示第i個作者Ai和第u個作者Au之間是否存在合作關系的一個變量,若存在,則令Xiu=1,否則,令Xiu=0,從而構造表示作者-作者同構網絡G′中各個作者之間關系的a×a維的鄰接矩陣X;
使用工具word2vec將第i個作者Ai所包含的作者屬性信息轉換成第i個特征向量,從而由a個特征向量構成a×h維的作者特征矩陣H,其中,h為特征向量的維數;
步驟2.2、利用式(4)生成作者節點嵌入矩陣Z=[z1,...,zi,.,za],zi表示第i個作者節點Ai的向量表示:
Z=g1(H,X) (4)
式(4)中,g1()為兩層的圖卷積網絡;
步驟2.3、利用式(5)生成重構鄰接矩陣并使用式(6)計算第i個作者Ai與第u個作者Au之間存在連邊的概率
式(6)中,zu表示第u個作者節點Au的向量表示;表示重構鄰接矩陣中第i個作者Ai和第u個作者Au是否存在合作關系的一個變量,若存在,令否則,令
步驟2.4、通過最小化式(7)所示的損失函數lg更新作者節點嵌入矩陣Z,從而得到更新后的作者節點嵌入矩陣表示更新后的第i個作者節點Ai的向量表示:
步驟3、計算作者-作者同構網絡G′=(A,ε)中作者間的相似度;
步驟3.1、分別利用式(8)和式(9)計算更新后的第i個作者Ai的向量表示與更新后的第u個作者Au的向量表示之間的余弦相似度與Tanimoto系數
步驟3.2、利用式(10)得到更新后的第i個作者Ai的向量表示與第u個作者Au的向量表示之間的相似度從而得到更新后的第i個作者Ai的向量表示與其他作者的向量表示之間的相似度,并從中選擇最大相似度所對應的作者作為第i個作者Ai所預測的最終合作對象:
式(10)中,θ表示Tanimoto系數所占的權重,并有:
式(11)中,R表示與第i個作者Ai和第u個作者Au之間擁有相同合作關系的作者的數量,即R=|AIi∩AIu|num,其中AIi表示與第i個作者Ai合作的作者集,AIu表示與第u個作者Au合作的作者集,B表示與第i個作者Ai擁有合作關系以及與第u個作者Au擁有合作關系的所有作者的數量,即B=|AIi∪AIu|num。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于安徽大學,未經安徽大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910832856.8/1.html,轉載請聲明來源鉆瓜專利網。
- 同類專利
- 專利分類
G06Q 專門適用于行政、商業、金融、管理、監督或預測目的的數據處理系統或方法;其他類目不包含的專門適用于行政、商業、金融、管理、監督或預測目的的處理系統或方法
G06Q10-00 行政;管理
G06Q10-02 .預定,例如用于門票、服務或事件的
G06Q10-04 .預測或優化,例如線性規劃、“旅行商問題”或“下料問題”
G06Q10-06 .資源、工作流、人員或項目管理,例如組織、規劃、調度或分配時間、人員或機器資源;企業規劃;組織模型
G06Q10-08 .物流,例如倉儲、裝貨、配送或運輸;存貨或庫存管理,例如訂貨、采購或平衡訂單
G06Q10-10 .辦公自動化,例如電子郵件或群件的計算機輔助管理





