日韩在线一区二区三区,日本午夜一区二区三区,国产伦精品一区二区三区四区视频,欧美日韩在线观看视频一区二区三区 ,一区二区视频在线,国产精品18久久久久久首页狼,日本天堂在线观看视频,综合av一区

[發(fā)明專利]一種基于高置信度特征屬性分層聚類方法的論文同名作者消歧方法有效

專利信息
申請?zhí)枺?/td> 201710861485.7 申請日: 2017-09-21
公開(公告)號: CN107590128B 公開(公告)日: 2021-08-17
發(fā)明(設(shè)計)人: 胡婕 申請(專利權(quán))人: 湖北大學(xué)
主分類號: G06F40/295 分類號: G06F40/295;G06F16/35
代理公司: 武漢科皓知識產(chǎn)權(quán)代理事務(wù)所(特殊普通合伙) 42222 代理人: 魯力
地址: 430062 湖北*** 國省代碼: 湖北;42
權(quán)利要求書: 查看更多 說明書: 查看更多
摘要:
搜索關(guān)鍵詞: 一種 基于 置信 特征 屬性 分層 方法 論文 同名 作者
【權(quán)利要求書】:

1.一種基于高置信度特征屬性分層聚類方法的多國論文同名作者消歧方法,其特征在于,包括:

步驟1、先從學(xué)術(shù)搜索引擎中抽取出原始數(shù)據(jù),提取出特征屬性值,對其進行規(guī)范化處理,具體是:

(1)去除元數(shù)據(jù)中的非ASCII字符,即視覺表現(xiàn)像“亂碼”的字符;

(2)將論文數(shù)據(jù)中所有的特征值均轉(zhuǎn)化成小寫;

(3)去掉包含無意義值的論文記錄;

步驟2、針對步驟1得到的規(guī)范化處理后的原始數(shù)據(jù),根據(jù)定義的規(guī)則先形成別名組,然后根據(jù)別名組生成同形異義作者歧義組具體包括:

對于每一個同形異義的作者名,生成作者名的所有拼寫形式作為其別名并存儲;由于文化多樣性,各個語言體系的人名命名規(guī)則差異非常大;體現(xiàn)在東方國家和西方國家的命名規(guī)則上的一個明顯不同,是東方國家總是把姓放在名的前面而西方國家把姓放在最后;考慮到不同語言體系的特點,對于不同國家的作者名字采取不同的處理策略;包括東方國家的人名和西方國家的人名,西方國家的名字又包括一名一姓及一名兩姓;

構(gòu)建歧義組需要經(jīng)過兩個步驟:首先生成所有的別名形式字符串,構(gòu)成別名組;接下來,獲取關(guān)于作者ai的包含別名組字符串中的任意一個作者名形式的論文記錄,即為歧義組

原子簇的定義:

一個原子簇是一個歧義組的子集,其中所有的論文記錄被指派給同一個真實作者;其純度由公式(1)決定,它表示原子簇中屬于真實作者ai的論文記錄數(shù)Nactual占簇中論文記錄總數(shù)Ntotal的比例;

顯然,所有純度為100%原子簇構(gòu)成歧義組的準確率將會達到100%;這樣的原子簇有一些重要的性質(zhì):由于原子簇中的所有的論文可以保證屬于同一個作者,則其中出現(xiàn)過的每一個合作作者,均相互認識,即簇中所有合作作者可以作為整個簇中每篇文章的合作作者;文章的出版單位也可以收集起來作為整個簇共有的出版單位信息,用來與其他類簇進行相似度計算或者作為進一步聚類的依據(jù);

在此基礎(chǔ)上,對原子簇進行聚類,能夠最大程度提高準確率和聚類效率;

步驟3、分別對各個單特征屬性進行相似度計算和消歧方法的選取,具體包括:

3.1合作作者屬性相似度函數(shù)和消歧方法的選取;

合作作者相似度函數(shù)通過

co_sim(c1,c2)=|coauthor(c1)∩coauthor(c2)|計算一對論文之間共同的合作作者數(shù)量;然而考慮到合作作者傳遞性,同一個歧義組中有三篇論文記錄c0、c1、c2,c0.CoAuthor={a0,a1},c1.CoAuthor={a1,a2},c2.CoAuthor={a2,a3},這種現(xiàn)象表面看起來像論文記錄c1傳遞了共同的合作作者a1和a2,因此c0和c2也應(yīng)當屬于同一個作者,盡管它們之間沒有任何共同的合作作者;要在算法中體現(xiàn)傳遞性,可以借鑒原子簇的性質(zhì);

3.2出版單位屬性相似度函數(shù)和消歧方法的選取;

首先獲得所有論文的所有出版單位,通過相似度函數(shù)pub_sim(c1,c2)=|publish(c1)∩publish(c2)|計算出版單位之間的相關(guān)性,考慮出版單位之間的相關(guān)性,定義相似領(lǐng)域的出版單位的相似度,從而建立相似度表;將領(lǐng)域和方向相近的出版單位直接分組;將出版單位屬于同一分組的論文進行聚合;這種消歧方法在每次發(fā)現(xiàn)新的類簇時,獲取所有相關(guān)的組Gp中的所有出版單位放入其中;

3.3關(guān)鍵詞屬性相似度函數(shù)和消歧方法的選取;

關(guān)鍵詞相似度函數(shù)通過keyword_sim(c1,c2)=|keyword(c1)∩keyword(c2)|計算兩篇論文關(guān)鍵詞之間的相關(guān)性;采用啟發(fā)式規(guī)則層次聚類方法對同名作者消歧;

3.4標題與摘要屬性相似度函數(shù)和消歧方法的選取;

首先對標題和摘要進行分詞處理,進行去停用詞和高詞頻無用詞的預(yù)處理;通過TF-IDF模型找到標題或者摘要中TF-IDF值高的關(guān)鍵詞;通過對兩篇文章的高頻詞詞頻向量計算余弦相似度,進行聚類;

步驟4、根據(jù)上述得到的消歧結(jié)果得到各屬性置信度排名高低,采用啟發(fā)式規(guī)則先對合作作者和關(guān)鍵詞屬性進行第一步聚類,當且僅當兩者的相似度滿足條件時,合并類簇,對于沒有合作作者和關(guān)鍵詞缺省的論文,在該步驟結(jié)果后仍然是自己作為單獨的簇;然后選擇置信度次之的標題和出版單位屬性,同樣采用啟發(fā)式規(guī)則,對第一步得到的類簇進行第二步聚類,該步 可以合并第一步聚類后留下的孤立的單獨簇,由此得到最終的聚類結(jié)果;

所述步驟4具體包括以下子步驟:

步驟5.1、初始化原子簇集合L={l1,l2,…,ln},令歧義組G={c1,c2,…,cn}中每篇論文單獨為簇,其中l(wèi)i.Attrk=ci.Attrk

步驟5.2、采用li.CoAuthor和li.Keywords對L進行聚類,得到新的原子簇集合L′={l′1,l′2,…,l′m},其中,對于每個原子簇l′i={li1,li2,…,lip},i≤m,

步驟5.3、采用l′i.Title和l′i.Publish對L′進行聚類,得到最終的聚類結(jié)果即為消歧結(jié)果。

下載完整專利技術(shù)內(nèi)容需要扣除積分,VIP會員可以免費下載。

該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于湖北大學(xué),未經(jīng)湖北大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服

本文鏈接:http://www.szxzyx.cn/pat/books/201710861485.7/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。

×

專利文獻下載

說明:

1、專利原文基于中國國家知識產(chǎn)權(quán)局專利說明書;

2、支持發(fā)明專利 、實用新型專利、外觀設(shè)計專利(升級中);

3、專利數(shù)據(jù)每周兩次同步更新,支持Adobe PDF格式;

4、內(nèi)容包括專利技術(shù)的結(jié)構(gòu)示意圖流程工藝圖技術(shù)構(gòu)造圖

5、已全新升級為極速版,下載速度顯著提升!歡迎使用!

請您登陸后,進行下載,點擊【登陸】 【注冊】

關(guān)于我們 尋求報道 投稿須知 廣告合作 版權(quán)聲明 網(wǎng)站地圖 友情鏈接 企業(yè)標識 聯(lián)系我們

鉆瓜專利網(wǎng)在線咨詢

周一至周五 9:00-18:00

咨詢在線客服咨詢在線客服
tel code back_top
主站蜘蛛池模板: 久久国产中文字幕| 国产免费区| 538在线一区二区精品国产| 国产精品96久久久| 国产精品天堂| 99精品少妇| 欧美激情在线观看一区| 国产一区2| 男女视频一区二区三区| 亚洲国产一区二区久久久777| 国产一级一区二区| 免费毛片**| 国产精品一二三区视频出来一| 四虎国产永久在线精品| 亚洲麻豆一区| 亚洲三区二区一区| 国语对白老女人一级hd| av中文字幕一区二区| 久久久久久久久亚洲精品| 欧美亚洲视频一区| 欧美在线视频一二三区| 538在线一区二区精品国产| 国产精品19乱码一区二区三区| 色婷婷精品久久二区二区我来| 欧美一区二区久久| 国产精品99一区二区三区| 国产资源一区二区三区| 亚洲福利视频一区| 国产亚洲精品久久777777| 国产精品美女一区二区视频| 精品少妇一区二区三区| 素人av在线| 91精品视频免费在线观看| 国产在线拍揄自揄拍| 国产偷亚洲偷欧美偷精品| 国产大学生呻吟对白精彩在线| 亚洲久久在线| 国产一级片自拍| 中文乱码在线视频| 久久99精品国产| 四虎国产精品永久在线国在线| 久久精品—区二区三区| 免费a级毛片18以上观看精品| 久久两性视频| 国产精品视频一区二区在线观看 | 亚洲精品无吗| 综合国产一区| 国产91一区| 国产精品乱战久久久| 99er热精品视频国产| 欧美一区二区三区久久| 中文字幕国内精品| 国产午夜精品免费一区二区三区视频 | 日本精品一区二区三区视频| 精品国产乱码久久久久久影片| 欧美激情视频一区二区三区| 国产午夜精品一区| 狠狠色狠狠色综合系列| 91麻豆产精品久久久| 99久久国产综合精品尤物酒店| 狠狠色依依成人婷婷九月| 亚洲一区欧美| 免费看农村bbwbbw高潮| 国产乱子一区二区| 麻豆精品国产入口| 狠狠色狠狠色综合日日2019| 亚洲精品久久久久久动漫| 国产精欧美一区二区三区久久| 午夜电影网一区| 91麻豆精品国产自产欧美一级在线观看| 精品福利一区| 日韩国产精品久久| 一级久久久| 国产videosfree性另类| 国产欧美三区| 性欧美1819sex性高播放| 99国产精品丝袜久久久久久| 国产欧美三区| 国产69精品久久久久777糖心| 日韩精品久久久久久久的张开腿让| 国产精品视频一区二区在线观看| 欧美hdxxxx| 91波多野结衣| 91九色精品| 国产精品精品国内自产拍下载| 欧美日韩国产一区二区三区在线观看| 精品videossexfreeohdbbw| 国产97在线播放| 亚洲国产精品国自产拍久久| 在线精品视频一区| 91精品免费观看| 国产97久久| 正在播放国产一区二区| 国产麻豆一区二区| 国产999久久久| 国模精品免费看久久久| 日本一区二区欧美| 精品久久小视频| 91日韩一区二区三区| 欧美一区免费| 欧美性xxxxx极品少妇| 精品一区二区三区视频?| 欧美激情视频一区二区三区| 欧美精品一区二区久久久| 国产91在线拍偷自揄拍| 亚洲精品国产综合| 国产精品视频久久| 中文字幕a一二三在线| 久精品国产| 91一区二区三区在线| 国内精品国产三级国产99| 欧美一区二区三区免费看| 午夜电影网一区| 狠狠色狠狠色综合婷婷tag| 国产精品美女久久久另类人妖| 国产精品中文字幕一区| 日韩欧美国产精品一区| 国产99视频精品免视看芒果| 欧美精品五区| 欧美精品五区| 精品少妇一区二区三区 | 91精品一区在线观看| 日韩a一级欧美一级在线播放| 538国产精品一区二区在线| 色吊丝av中文字幕| 中文丰满岳乱妇在线观看| 91麻豆精品一区二区三区| 中文字幕理伦片免费看| 久久99久久99精品免观看软件| 色噜噜日韩精品欧美一区二区 | 韩国女主播一区二区| 欧美激情在线免费| 国产精品入口麻豆九色| 亚州精品中文| 伊人av综合网| 国产一区二区三区影院| 91精品视频在线免费观看| 午夜欧美a级理论片915影院| 精品一区二区超碰久久久| 处破大全欧美破苞二十三| 国产69精品久久99不卡免费版| 午夜激情电影在线播放| 欧美精品中文字幕在线观看| 亚洲少妇中文字幕| 国产午夜精品一区二区理论影院| 国产精品欧美一区二区三区| 国产精品一区二区日韩新区| 欧美国产一区二区在线| av素人在线| 中出乱码av亚洲精品久久天堂| 久久久中精品2020中文| 久久五月精品| 国产999精品视频| 少妇bbwbbwbbw高潮| 少妇又紧又色又爽又刺激的视频 | 国产九九九精品视频| 夜夜精品视频一区二区| 欧美69精品久久久久久不卡| 少妇又紧又色又爽又刺激视频网站| 亚洲麻豆一区| 欧美hdfree性xxxx| 91avpro| 亚洲国产另类久久久精品性| 午夜国内精品a一区二区桃色| 久久久久久国产一区二区三区| 精品一区二区超碰久久久| 狠狠躁狠狠躁视频专区| 国产一区二区三区黄| 国产精品美女一区二区视频| 国产丝袜一区二区三区免费视频 | 日韩一区二区三区福利视频| 91久久精品在线| 久久精品视频3| 狠狠色丁香久久综合频道日韩| 欧美一区二区三区久久久久久桃花| 国产精品自产拍在线观看蜜| 日本二区在线观看| 国产一区二区在线观| 91偷拍网站| 99精品国产99久久久久久97| 国产的欧美一区二区三区| 欧美性猛交xxxxxⅹxx88| 99热久久这里只精品国产www| 欧美激情视频一区二区三区免费| 国产精品一区二区免费视频| 日本中文字幕一区| 国产精品v一区二区三区| 久久激情影院| 午夜av在线电影| 国语对白老女人一级hd| 妖精视频一区二区三区| 欧美日韩一二三四区| 久久99精品国产一区二区三区| 中文丰满岳乱妇在线观看| 狠狠插影院| 国产日韩精品一区二区三区| 性刺激久久久久久久久九色| 精品在线观看一区二区| 中文丰满岳乱妇在线观看| 国产一区二区播放| 国产精品亚洲精品| 国产又黄又硬又湿又黄| 亚洲乱小说| 国内久久精品视频| 午夜精品一区二区三区三上悠亚| 国产农村乱色xxxx| 91精品啪在线观看国产| 日韩中文字幕在线一区二区| av中文字幕一区二区| 久久99国产视频| 91精品视频在线免费观看| 中文字幕亚洲欧美日韩在线不卡| 久久国产精品二区| 日韩午夜三级| 黄色av免费| 68精品国产免费久久久久久婷婷| 国产欧美一二三区| 精品国产乱码久久久久久虫虫| 扒丝袜网www午夜一区二区三区| 国产999精品视频| 国模一区二区三区白浆| 久久三级精品| 精品国产一区二区三区国产馆杂枝| 97精品超碰一区二区三区| 国产盗摄91精品一区二区三区| 午夜wwww| 亚洲福利视频一区| 国产欧美精品一区二区三区-老狼| 超碰97国产精品人人cao| 国产一区二区黄| 亚洲精品乱码久久久久久高潮| 躁躁躁日日躁网站| 91麻豆精品国产91久久久更新时间| 久久精品国产色蜜蜜麻豆| 少妇bbwbbwbbw高潮| 亚洲国产欧美一区| 欧美日韩亚洲另类| 色噜噜狠狠色综合影视| 日韩欧美高清一区| 精品国产区| 四虎国产精品永久在线| 视频一区二区中文字幕| 欧美一级久久精品| 91精品久久久久久| 日本三级不卡视频| 久久天天躁夜夜躁狠狠躁2022|