[發明專利]一種基于文獻引用關系的刊物聚類方法有效
| 申請號: | 201711078085.5 | 申請日: | 2017-11-06 |
| 公開(公告)號: | CN107832412B | 公開(公告)日: | 2020-06-30 |
| 發明(設計)人: | 梅建萍;王杰 | 申請(專利權)人: | 浙江工業大學 |
| 主分類號: | G06F16/35 | 分類號: | G06F16/35;G06K9/62 |
| 代理公司: | 杭州賽科專利代理事務所(普通合伙) 33230 | 代理人: | 郭薇 |
| 地址: | 310014 浙*** | 國省代碼: | 浙江;33 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 文獻 引用 關系 刊物 方法 | ||
1.一種基于文獻引用關系的刊物聚類方法,其特征在于:所述方法包括以下步驟:
步驟1:收集刊物所發表的論文信息以及論文之間的引用關系,計算刊物之間的相關度,將T個“論文-論文”的引用關系進行逐行轉換,得到T行“刊物-刊物”關系;
步驟2:合并T行“刊物-刊物”關系,得到n個刊物之間的關系W,建立以刊物為節點的關系網絡;
所述步驟2包括以下步驟:
步驟2.1:對于任意的兩個刊物Js和Jh,統計T行“刊物-刊物”關系中出現所述兩個刊物Js和Jh的引用關系Js→Jh的次數Ws,h,以Ws,h作為所述兩個刊物Js和Jh的相關度;
步驟2.2:循環處理T行“刊物-刊物”關系,得到一個以n個刊物為節點、刊物之間關系為邊的有向圖W;
步驟3:采用譜聚類對以刊物為節點的關系網絡W進行刊物劃分,對刊物進行迭代聚類,得到聚類結果。
2.根據權利要求1所述的一種基于文獻引用關系的刊物聚類方法,其特征在于:所述步驟1包括以下步驟:
步驟1.1:以記錄Pi→Pj表示論文Pi引用了論文Pj;
步驟1.2:分別識別論文Pi初次刊發于刊物Js上、論文Pj初次刊發于刊物Jh上;
步驟1.3:得到“刊物-刊物”關系Js→Jh;
步驟1.4:循環T個“論文-論文”的引用關系進行逐行轉換,得到T行“刊物-刊物”關系。
3.根據權利要求1所述的一種基于文獻引用關系的刊物聚類方法,其特征在于:所述刊物包括發表論文的期刊、會議集和圖書。
4.根據權利要求1所述的一種基于文獻引用關系的刊物聚類方法,其特征在于:所述有向圖W中,Ws,h作為每條邊的權重,代表刊物Js上的論文對刊物Jh上的論文的總引用次數。
5.根據權利要求1所述的一種基于文獻引用關系的刊物聚類方法,其特征在于:所述步驟3包括以下步驟:
步驟3.1:由有向圖W計算得到對稱矩陣A,A=(W+WT)/2;
步驟3.2:設置聚類的類目數k,0≤k≤0.5n;
步驟3.3:計算對稱矩陣A每行的和,得到對角矩陣D,對角矩陣D中每個對角元素其中,p和q分別代表對稱矩陣A的第p列和第q行;
步驟3.4:計算規范化的拉普拉斯矩陣L,
步驟3.5:對矩陣L進行矩陣的特征分解,得到n個特征值及相應的特征向量,對n個特征值排序選出最小的k個特征值,由其對應的特征向量組成矩陣V=[v1,v2,...vc,...vk],其中,vc對應第c個特征值的特征向量,c=1,...k;
步驟3.6:歸一化所有矩陣V中的橫向量,使矩陣V中的各元素之和為1,得到矩陣V';
步驟3.7:將矩陣V'中的每一行看成是一個對象的特征表示,以k-means得到所有矩陣V'的n個對象的k個類的聚類。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于浙江工業大學,未經浙江工業大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201711078085.5/1.html,轉載請聲明來源鉆瓜專利網。





