[發明專利]一種學術異構信息網絡中作者合作關系預測的方法在審
| 申請號: | 201611242612.7 | 申請日: | 2016-12-29 |
| 公開(公告)號: | CN106778894A | 公開(公告)日: | 2017-05-31 |
| 發明(設計)人: | 夏鋒;劉鑫童;寧兆龍;張舒虹;王偉 | 申請(專利權)人: | 大連理工大學 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62 |
| 代理公司: | 大連理工大學專利中心21200 | 代理人: | 溫福雪,侯明遠 |
| 地址: | 116024 遼*** | 國省代碼: | 遼寧;21 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 學術 信息網絡 作者 合作關系 預測 方法 | ||
技術領域
本發明涉及學術異構信息網絡下的作者合作關系預測方法,尤其涉及一種基于元路徑和內容信息的合作預測方法。
背景技術
隨著科學研究在學術界和工業界廣泛進行,學者們創造出源源不斷的大量科研成果,于是學術大數據應運而生。學術大數據中存在不同的學術主體以及它們之間形成的各種各樣的學術關系,其中學者之間的合作關系最為普遍和重要,尤其在交叉學科問題的研究中,來自不同領域的學者之間的合作日益增多,這使得對于合作關系預測的研究變得越來越重要。但在現有的技術中,大多數解決方法都是基于同構信息網絡的,而且預測方法都是基于節點、拓撲和網絡內容信息相似性等,而這些并不能很好的體現出學者之間的相互聯系,沒有考慮節點屬性和網絡的內容信息等對預測結果的影響。總結以上缺點,本發明從學術異構信息網絡抽取的基于元路徑和內容信息的特征空間作為輸入,利用有監督學習算法進行學者合作關系預測,能夠提高合作者的預測準確率。
發明內容
本發明的目的主要針對上述現有研究的一些不足之處,提出學術異構信息網絡下基于元路徑和內容信息的合作預測方法,利用有監督學習算法進行學者合作關系預測。本發明將作者之間未來合作的可能性建模為他們之間特征屬性的函數,從訓練集中獲取作者之間的特征屬性,然后通過建立預測模型來得到與每個屬性特征相關的最適合系數。
本發明的技術方案:
一種學術異構信息網絡中作者合作關系預測的方法,步驟如下:
1)模型訓練階段,選出在過去時間段沒有合作過的作者對,收集其在過去時間段內相關的基于元路徑和內容信息的特征屬性,并記錄他們在未來時間段中是否建立合作關系
本方法提出的預測模型采用基于邏輯回歸的有監督學習算法,在一個學術異構信息網絡G=<V,E>中,V代表信息網絡中的節點,E代表節點之間的交互,任意連邊e=<x,y>∈E表示節點x和y之間在某一特定時間t(e)的交互,并用平行邊記錄節點對之間的多重交互及其潛在時間戳信息;對于任意兩個時間節點t<t′,用G[t,t′]表示包含時間段t到t′之間所有連邊的子圖,鏈路預測問題的具體描述如下:選擇四個時間戳t0<t′0<t1<t′1,鏈路預測就是預測在G[t0,t′0]中沒有出現而將在G[t1,t′1]中出現的連邊,并用T0=[t0,t′0]表示過去時間段,T1=[t1,t′1]表示未來時間段;但是,信息網絡隨著新的連邊和節點的加入不斷增長,顯然對于預測不存在于過去時間段中的節點對之間的連邊是不明智的。因此,本方法選出核心節點集合,即節點既存在于過去時間段的子圖G[t0,t′0]中,也存在于未來時間段的子圖G[t1,t′1]中,然后預測在核心節點集合中的節點之間產生新連邊的可能性。
在模型訓練階段,首先選出在T0時間段沒有合作過的作者對,收集其在T0時間段相關的基于元路徑和內容信息的特征屬性,根據真實網絡情況,查看并記錄他們在未來時間段T1中是否建立合作關系。
2)建立訓練模型,通過最大化合作關系的可能性學習與每個特征屬性相關的最佳權重系數
2.1)計算基于時間動態的路徑數:學術異構信息網絡是隨時間變化的,學術異構信息網絡中學術主體之間形成的路徑也是具有時變性的,本方法通過對這些路徑設置不同權重來實現對在不同時間戳形成的路徑進行影響力區分。綜合考慮學術異構信息網絡中的時間動態特性和基于元路徑的路徑數度量,得到基于時間動態的路徑數屬性。
一個元路徑以由很多短的子元路徑連接而成,而且學術異構信息網絡中的路徑通常是事件發生的結果;為區分不同元路徑的影響力,首先將元路徑分解為很多事件子元路徑,例如,元路徑“作者-論文-會議-論文-作者”描述了兩個作者在同一會議發表論文的關系,可以被分解為“作者-論文-會議”和“會議-論文-作者”,這兩個事件子元路徑都描述了作者在某一會議發表論文的事件。之后,根據這些事件子元路徑建立的時間參考衰減函數為其設置不同權重。
給定一個元路徑P=(A1A2L Al),它的交換矩陣表示為:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于大連理工大學,未經大連理工大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201611242612.7/2.html,轉載請聲明來源鉆瓜專利網。





