[發(fā)明專利]一種融合學(xué)術(shù)影響力的學(xué)者人名消除歧義的方法有效
| 申請(qǐng)?zhí)枺?/td> | 201810067134.3 | 申請(qǐng)日: | 2018-01-24 |
| 公開(公告)號(hào): | CN108304380B | 公開(公告)日: | 2020-09-22 |
| 發(fā)明(設(shè)計(jì))人: | 鄧輝舫;李超然 | 申請(qǐng)(專利權(quán))人: | 華南理工大學(xué) |
| 主分類號(hào): | G06F40/295 | 分類號(hào): | G06F40/295 |
| 代理公司: | 廣州市華學(xué)知識(shí)產(chǎn)權(quán)代理有限公司 44245 | 代理人: | 馮炳輝 |
| 地址: | 510640 廣*** | 國省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 融合 學(xué)術(shù) 影響力 學(xué)者 人名 消除 歧義 方法 | ||
1.一種融合學(xué)術(shù)影響力的學(xué)者人名消除歧義的方法,其特征在于:該方法是以實(shí)現(xiàn)將待消歧人名與學(xué)者實(shí)體準(zhǔn)確對(duì)應(yīng)為目標(biāo),通過融合學(xué)者影響力,改進(jìn)相似度計(jì)算模型,提出增強(qiáng)的影響力計(jì)算模型,而后通過改進(jìn)網(wǎng)絡(luò)結(jié)構(gòu)、模型聚類函數(shù)和模型組合,以達(dá)到更高的消歧準(zhǔn)確率;其包括以下步驟:
步驟S1、將學(xué)者數(shù)據(jù)集合U按名字分組得到n個(gè)名字組A,根據(jù)文獻(xiàn)將每個(gè)名字組劃分為m個(gè)學(xué)者實(shí)體節(jié)點(diǎn)a;
數(shù)據(jù)集合U中包含待消歧的各個(gè)同名學(xué)者名字組A,U={A1,A2,...,An},其中Ai為U中第i個(gè)名字組,包含Ai所對(duì)應(yīng)學(xué)者人名的所著文獻(xiàn)屬性及其合著者信息;對(duì)于所得到的每個(gè)名字組,以文獻(xiàn)來區(qū)分學(xué)者實(shí)體,將組中每個(gè)文獻(xiàn)中的待消歧學(xué)者名字作為一個(gè)學(xué)者實(shí)體;假設(shè)名字組Ai中有m篇文獻(xiàn),則將該名字組劃分為m個(gè)學(xué)者實(shí)體aij,即Ai={ai1,ai2,...,aim},其中0<i≤n,0<j≤m;
步驟S2、根據(jù)步驟S1劃分結(jié)果,對(duì)每個(gè)組A,分別在組內(nèi)學(xué)者實(shí)體節(jié)點(diǎn)與U中名字組節(jié)點(diǎn)間通過合作關(guān)系建立合作關(guān)系網(wǎng)絡(luò)G;
步驟S3、對(duì)于每個(gè)組A,結(jié)合節(jié)點(diǎn)相似度和自身重要性,在合作關(guān)系網(wǎng)絡(luò)G上計(jì)算A中各個(gè)學(xué)者實(shí)體節(jié)點(diǎn)a基于特征集F的學(xué)術(shù)影響力
步驟S4、使用網(wǎng)絡(luò)嵌入匿名圖方法,結(jié)合步驟S3所得節(jié)點(diǎn)的學(xué)術(shù)影響力,得到文獻(xiàn)矩陣D,根據(jù)D計(jì)算得到名字組內(nèi)學(xué)者實(shí)體節(jié)點(diǎn)a帶學(xué)術(shù)影響力約束的相似度Sa;
步驟S5、利用步驟S4所得相似度,重復(fù)步驟S1~S3重新計(jì)算學(xué)術(shù)影響力,得到學(xué)者實(shí)體節(jié)點(diǎn)a基于學(xué)術(shù)影響力相似度的新的學(xué)術(shù)影響力其中S表示該節(jié)點(diǎn)帶學(xué)術(shù)影響力約束的相似度;
步驟S6、根據(jù)節(jié)點(diǎn)學(xué)術(shù)影響力的差異和相似度得到聚類函數(shù)C,使用凝聚層次聚類算法得到消歧結(jié)果。
2.根據(jù)權(quán)利要求1所述的一種融合學(xué)術(shù)影響力的學(xué)者人名消除歧義的方法,其特征在于:在步驟S2中,將步驟S1中所得每一個(gè)名字組A中的學(xué)者實(shí)體節(jié)點(diǎn)a,與A在數(shù)據(jù)集合U上的補(bǔ)集CUA中的各個(gè)名字組節(jié)點(diǎn)間建立合作關(guān)系網(wǎng)絡(luò)G=(A∪CUA,E),其中,E為網(wǎng)絡(luò)中邊的集合,表示節(jié)點(diǎn)間的合作關(guān)系,各實(shí)體節(jié)點(diǎn)與名字組節(jié)點(diǎn)分別通過合著關(guān)系和引用關(guān)系構(gòu)成邊,合著關(guān)系為雙向邊,引用關(guān)系為單向邊。
3.根據(jù)權(quán)利要求1所述的一種融合學(xué)術(shù)影響力的學(xué)者人名消除歧義的方法,其特征在于:在步驟S3中,根據(jù)步驟S2所得的合作關(guān)系網(wǎng)絡(luò),在包含學(xué)者和文獻(xiàn)特征的數(shù)據(jù)集上采用細(xì)粒度特征的學(xué)術(shù)影響力評(píng)估算法,結(jié)合自身重要性和影響概率構(gòu)建基于特征集F的學(xué)術(shù)影響力;F為從待消歧數(shù)據(jù)集合U中選取的特征集F={f1,f2,...,fn},其中,fn表示F中第n個(gè)特征;為A定義一組特征強(qiáng)度向量其中:
a、節(jié)點(diǎn)的自身重要性Iout為節(jié)點(diǎn)基于角色的重要性,以特征強(qiáng)度來度量,其關(guān)系表示為其中n為特征數(shù)量,fi表示在第i個(gè)特征上的強(qiáng)度;
b、節(jié)點(diǎn)間的影響概率由直接影響即節(jié)點(diǎn)相似度和間接影響即公共邊數(shù)量構(gòu)成;其關(guān)系為其中q為直接影響在影響概率中所占比例;結(jié)合節(jié)點(diǎn)的自身重要性Iout,及其鄰居節(jié)點(diǎn)的影響概率節(jié)點(diǎn)的初始學(xué)術(shù)影響力II表示如下:
其中p為自身重要性在初始學(xué)術(shù)影響力中所占的比例,N表示計(jì)算節(jié)點(diǎn)對(duì)象的鄰居節(jié)點(diǎn)集合,節(jié)點(diǎn)a和A的鄰居節(jié)點(diǎn)集合分別表示為Na和NA;
假設(shè)節(jié)點(diǎn)以一定概率相互傳播;節(jié)點(diǎn)間的學(xué)術(shù)影響力貢獻(xiàn)IF表示如下:
其中為運(yùn)算目標(biāo)節(jié)點(diǎn)的鄰居節(jié)點(diǎn)的學(xué)術(shù)影響力,為節(jié)點(diǎn)間的傳播概率,節(jié)點(diǎn)a對(duì)A的傳播概率表示為A對(duì)a的傳播概率表示為初始時(shí),IF=II;
迭代計(jì)算節(jié)點(diǎn)的學(xué)術(shù)影響力,得到實(shí)體節(jié)點(diǎn)a較理想的學(xué)術(shù)影響力,表示為
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于華南理工大學(xué),未經(jīng)華南理工大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810067134.3/1.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 一種用學(xué)術(shù)術(shù)語導(dǎo)航網(wǎng)絡(luò)學(xué)術(shù)資源的方法
- 一種學(xué)術(shù)指數(shù)體系及其發(fā)布方法
- 學(xué)術(shù)資料搜索方法和裝置
- 一種基于用戶行為的學(xué)術(shù)資源推薦方法
- 加權(quán)學(xué)術(shù)績效考核方法及系統(tǒng)
- 學(xué)術(shù)項(xiàng)目推薦
- 用于學(xué)術(shù)會(huì)議的學(xué)術(shù)報(bào)告管理方法和管理系統(tǒng)
- 一種醫(yī)學(xué)術(shù)語系統(tǒng)的構(gòu)建方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 醫(yī)學(xué)術(shù)語標(biāo)準(zhǔn)化方法、裝置、電子設(shè)備及存儲(chǔ)介質(zhì)
- 一種適用于標(biāo)準(zhǔn)醫(yī)學(xué)術(shù)語的驗(yàn)證系統(tǒng)及方法
- 一種基于信息交互網(wǎng)絡(luò)的微博用戶影響力計(jì)算方法
- 一種個(gè)體與群體之間的影響力評(píng)估方法
- 一種評(píng)估準(zhǔn)確的網(wǎng)絡(luò)用戶影響力評(píng)估系統(tǒng)
- 一種社交網(wǎng)絡(luò)用戶影響力的評(píng)估方法
- 一種媒體影響力評(píng)估方法、裝置及電子設(shè)備
- 一種影響力評(píng)估方法及評(píng)估裝置
- 專家影響力的生成方法、專家推薦方法及電子設(shè)備
- 一種結(jié)合社交網(wǎng)絡(luò)的圈層用戶影響力評(píng)估方法
- 一種結(jié)合社交網(wǎng)絡(luò)的圈層用戶綜合影響力評(píng)估及偽造判別方法
- 影響力投資評(píng)估系統(tǒng)及其構(gòu)建方法
- 基于學(xué)者科研成果挖掘的學(xué)者精準(zhǔn)定位方法及裝置
- 科研社群劃分及核心學(xué)者發(fā)現(xiàn)方法、系統(tǒng)、介質(zhì)及終端
- 一種面向?qū)W者的用戶畫像構(gòu)建及應(yīng)用方法
- 基于學(xué)者論文關(guān)系網(wǎng)絡(luò)的學(xué)者學(xué)術(shù)影響力計(jì)算方法及系統(tǒng)
- 一種基于引文網(wǎng)絡(luò)與科研合作網(wǎng)絡(luò)的領(lǐng)域?qū)<义噙x方法
- 基于知識(shí)圖譜的專業(yè)特長學(xué)者推薦方法
- 基于大數(shù)據(jù)分析的個(gè)性化教育管理系統(tǒng)、方法、介質(zhì)
- 一種基于異質(zhì)學(xué)術(shù)網(wǎng)絡(luò)進(jìn)行學(xué)者畫像的方法及系統(tǒng)
- 一種基于合作網(wǎng)絡(luò)的學(xué)者檢索方法和裝置
- 凳(學(xué)者)





