[發(fā)明專利]基于論文作者信息提取和關(guān)系權(quán)值模型的學(xué)術(shù)關(guān)系網(wǎng)構(gòu)造方法在審
| 申請(qǐng)?zhí)枺?/td> | 201410395729.3 | 申請(qǐng)日: | 2014-08-13 |
| 公開(公告)號(hào): | CN104156437A | 公開(公告)日: | 2014-11-19 |
| 發(fā)明(設(shè)計(jì))人: | 袁偉;鄧攀;閆碧瑩;李玉成 | 申請(qǐng)(專利權(quán))人: | 中科嘉速(北京)并行軟件有限公司 |
| 主分類號(hào): | G06F17/30 | 分類號(hào): | G06F17/30 |
| 代理公司: | 北京永創(chuàng)新實(shí)專利事務(wù)所 11121 | 代理人: | 祗志潔 |
| 地址: | 100190 *** | 國(guó)省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說(shuō)明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 基于 論文 作者 信息 提取 關(guān)系 模型 學(xué)術(shù) 關(guān)系網(wǎng) 構(gòu)造 方法 | ||
1.一種基于論文作者信息提取和關(guān)系權(quán)值模型的學(xué)術(shù)關(guān)系網(wǎng)構(gòu)建方法,其特征在于,通過(guò)如下步驟實(shí)現(xiàn):
步驟1、提取作者信息,構(gòu)建初始的作者關(guān)系矩陣;所述的作者關(guān)系矩陣的第i行第j列的元素值為作者i和作者j的關(guān)系值,用0表示作者與自己的關(guān)系,-1表示兩位作者之間的關(guān)系不可達(dá);初始的作者關(guān)系矩陣中,對(duì)角線上元素值為0,其余位置元素值為-1;
步驟2:建立作者關(guān)系權(quán)值模型,根據(jù)每篇論文的作者信息更新作者關(guān)系矩陣;
所述的作者關(guān)系權(quán)值模型為:設(shè)一篇論文P,包括通訊作者在內(nèi)共有N個(gè)作者,設(shè)作者A和B分別為論文P的第m作者和第n作者,則論文P為作者A與B的關(guān)系值貢獻(xiàn)的參考值Relation<P,<A,B>>=
其中,c為第一作者和通訊作者的關(guān)系加強(qiáng)值;x表示作者機(jī)構(gòu)決定的作者關(guān)系的權(quán)重;當(dāng)A和B屬于同一機(jī)構(gòu)或單位時(shí),參數(shù)T的值為1,否則T的值為0;S為由作者次序反映作者關(guān)系遠(yuǎn)近信息的分界值;d表示第一作者和作者次序在S+1位之前的非通訊作者的關(guān)系加強(qiáng)值;e表示第一作者和作者次序在S位之后的非通訊作者的關(guān)系在關(guān)系加強(qiáng)值d基礎(chǔ)上的削弱值;所得到的參考值四舍五入到整數(shù);
設(shè)k篇論文為作者A和B的關(guān)系值貢獻(xiàn)的參考值分別為r1,r2,…,rk,則作者A和B的關(guān)系值為:用得到的關(guān)系值更新作者關(guān)系矩陣中表示A和B關(guān)系值的元素值;
步驟3:基于步驟2更新的作者關(guān)系矩陣確定兩兩作者間最優(yōu)關(guān)系傳遞路徑,最優(yōu)關(guān)系傳遞路徑需滿足以下幾個(gè)條件:
1)兩者之間經(jīng)過(guò)的路徑絕對(duì)值長(zhǎng)度最短;
2)在所有最短路徑中關(guān)系值和最大;
3)經(jīng)過(guò)的最短路徑小于6;
根據(jù)最優(yōu)關(guān)系傳遞路徑構(gòu)建作者關(guān)系圈;
步驟4、定期更新作者關(guān)系矩陣和作者關(guān)系圈。
2.根據(jù)權(quán)利要求1所述的基于論文作者信息提取和關(guān)系權(quán)值模型的學(xué)術(shù)關(guān)系網(wǎng)構(gòu)建方法,其特征在于,步驟3中所述的最優(yōu)關(guān)系傳遞路徑,具體獲取方法是:
步驟3.1、將作者關(guān)系矩陣中作者集合記為W,M表示集合W的元素個(gè)數(shù),設(shè)置一個(gè)標(biāo)志數(shù)組s[v][1,2…,M]記錄作者v到哪些作者的最優(yōu)關(guān)系傳遞路徑已經(jīng)找到,數(shù)組中1表示最優(yōu)關(guān)系傳遞路徑已經(jīng)找到,0表示最優(yōu)關(guān)系傳遞路徑未找到;
初始時(shí),s[v][v]=1;s[v][i]=0,i=1,2…,M,i≠v;1v、i分別為作者關(guān)系矩陣中的第i作者、第v作者;
步驟3.2、設(shè)置數(shù)組dist[v][1,2…,M]記錄作者v到各作者的最優(yōu)關(guān)系傳遞路徑的路徑長(zhǎng)度,其中,dist[v][i]記錄作者v到作者i的最優(yōu)關(guān)系傳遞路徑的路徑長(zhǎng)度;初始時(shí),dist[v][i]根據(jù)標(biāo)志數(shù)組s來(lái)設(shè)置,若s[v][i]=1,則設(shè)置dist[v][i]=1,否則設(shè)置dist[v][i]=M;
步驟3.3、設(shè)置數(shù)組path[v][1,2…,M]記錄作者v到各作者的最優(yōu)關(guān)系傳遞路徑,其中path[v][i]記錄作者v到作者i的最優(yōu)關(guān)系傳遞路徑;初始時(shí),若s[v][i]=1,設(shè)置path[v][i]={i},否則,設(shè)置path[i]為空;
步驟3.4、利用標(biāo)志數(shù)組s與作者關(guān)系矩陣,找出所有與作者v關(guān)系值超過(guò)閾值maxRela的作者集合Uv:
Uv={u|u∈W,且u≠v,rela[v,u]>maxRela},
其中,對(duì)于Uv中的任意u,置s[v][u]=1,更新path[v][u]={u},更新dist[v][u]=1;
重復(fù)步驟3.4M次,找到所有作者與其直接可達(dá)的作者;
步驟3.5、對(duì)于步驟3.4中確定的作者集合Uv,遍歷Uv中各作者u,并進(jìn)行如下操作:
將作者v到作者u的路徑長(zhǎng)度加到作者u到作者r的路徑長(zhǎng)度上,得到dist[u][r]+1,對(duì)應(yīng)作者v通過(guò)作者u到達(dá)作者r的一條新關(guān)系傳遞路徑;
首先判斷dist[u][r]+1是否小于6,若否,保持dist[v][r]的值不變;若是,分如下三種情況處理:
(1)若加后的長(zhǎng)度dist[u][r]+1小于當(dāng)前作者v到作者r的關(guān)系傳遞路徑長(zhǎng)度dist[v][r],則將dist[v][r]的值替換為dist[u][r]+1;
(2)若加后的長(zhǎng)度dist[u][r]+1等于當(dāng)前作者v到作者r的關(guān)系傳遞路徑長(zhǎng)度dist[v][r],則比較新關(guān)系傳遞路徑上關(guān)系值的累加值是否大于原來(lái)關(guān)系傳遞路徑上關(guān)系值的累加值,若是,將dist[v][r]的值替換為dist[u][r]+1,否則,保持dist[v][r]的值不變;
(3)若加后的長(zhǎng)度dist[u][r]+1大于當(dāng)前作者v到作者r的關(guān)系傳遞路徑長(zhǎng)度dist[v][r],保持dist[v][r]的值不變;
若替換dist[v][r]的值,將更新作者v到作者r的關(guān)系傳遞路徑path[v][r]為:作者v到作者u的關(guān)系傳遞路徑path[v][u]再加作者u到作者r的關(guān)系傳遞路徑path[u][r];
重復(fù)步驟3.5M次,得到作者關(guān)系矩陣中任意兩作者間的最優(yōu)關(guān)系傳遞路徑;
步驟3.6、根據(jù)dist數(shù)組更新標(biāo)志數(shù)組,對(duì)于作者關(guān)系矩陣中任意兩個(gè)作者i、j,i,j=1,2,…M,更新對(duì)應(yīng)的標(biāo)志數(shù)組s[i][j]為:
s[i][j]=1表示作者i到作者j的最優(yōu)關(guān)系傳遞路徑已經(jīng)找到,s[i][j]=0表示作者i到作者j的最優(yōu)關(guān)系傳遞路徑未找到。
3.根據(jù)權(quán)利要求2所述的基于論文作者信息提取和關(guān)系權(quán)值模型的學(xué)術(shù)關(guān)系網(wǎng)構(gòu)建方法,其特征在于,步驟3.4中所述的maxRela的取值范圍為1.5~3.5。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于中科嘉速(北京)并行軟件有限公司,未經(jīng)中科嘉速(北京)并行軟件有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201410395729.3/1.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06F 電數(shù)字?jǐn)?shù)據(jù)處理
G06F17-00 特別適用于特定功能的數(shù)字計(jì)算設(shè)備或數(shù)據(jù)處理設(shè)備或數(shù)據(jù)處理方法
G06F17-10 .復(fù)雜數(shù)學(xué)運(yùn)算的
G06F17-20 .處理自然語(yǔ)言數(shù)據(jù)的
G06F17-30 .信息檢索;及其數(shù)據(jù)庫(kù)結(jié)構(gòu)
G06F17-40 .數(shù)據(jù)的獲取和記錄
G06F17-50 .計(jì)算機(jī)輔助設(shè)計(jì)
- 信息記錄介質(zhì)、信息記錄方法、信息記錄設(shè)備、信息再現(xiàn)方法和信息再現(xiàn)設(shè)備
- 信息記錄裝置、信息記錄方法、信息記錄介質(zhì)、信息復(fù)制裝置和信息復(fù)制方法
- 信息記錄裝置、信息再現(xiàn)裝置、信息記錄方法、信息再現(xiàn)方法、信息記錄程序、信息再現(xiàn)程序、以及信息記錄介質(zhì)
- 信息記錄裝置、信息再現(xiàn)裝置、信息記錄方法、信息再現(xiàn)方法、信息記錄程序、信息再現(xiàn)程序、以及信息記錄介質(zhì)
- 信息記錄設(shè)備、信息重放設(shè)備、信息記錄方法、信息重放方法、以及信息記錄介質(zhì)
- 信息存儲(chǔ)介質(zhì)、信息記錄方法、信息重放方法、信息記錄設(shè)備、以及信息重放設(shè)備
- 信息存儲(chǔ)介質(zhì)、信息記錄方法、信息回放方法、信息記錄設(shè)備和信息回放設(shè)備
- 信息記錄介質(zhì)、信息記錄方法、信息記錄裝置、信息再現(xiàn)方法和信息再現(xiàn)裝置
- 信息終端,信息終端的信息呈現(xiàn)方法和信息呈現(xiàn)程序
- 信息創(chuàng)建、信息發(fā)送方法及信息創(chuàng)建、信息發(fā)送裝置





