[發明專利]基于論文間引用關系的學術地圖展示方法有效
| 申請號: | 201610029065.8 | 申請日: | 2016-01-15 |
| 公開(公告)號: | CN105718528B | 公開(公告)日: | 2019-06-21 |
| 發明(設計)人: | 談兆煒;毛宇寧;劉長風;劉興邦;張文斌;趙璟浩;宋振宇;沈嘉明;郭運奇;王彪;傅洛伊;王新兵 | 申請(專利權)人: | 上海交通大學 |
| 主分類號: | G06F16/332 | 分類號: | G06F16/332;G06F16/35 |
| 代理公司: | 上海漢聲知識產權代理有限公司 31236 | 代理人: | 郭國中 |
| 地址: | 200240 *** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 論文 引用 關系 學術 地圖 展示 方法 | ||
1.一種基于論文間引用關系的學術地圖展示方法,其特征在于,包括如下步驟:
步驟1:利用聚類算法及分布式處理法將事先獲取的論文引用關系數據進行聚類,并劃分為多個社區;
步驟2:分析多個社區的屬性和含義,將相關的引用關系數據存入數據庫中;
步驟3:讀取數據庫中的引用關系數據并構建論文引用網絡,利用可視化工具動態展現論文間的關系,找到目標論文;
步驟4:在多個視角上展示論文間的引用關系,形成學術地圖;
所述步驟2包括:
步驟2.1:對論文引用關系數據的內容進行分析,得到所劃分社區的屬性或含義;
步驟2.2:提取相關論文的信息,存儲于MySQL數據庫中用于進一步處理與展示;
所述步驟3包括:
步驟3.1:讀取數據庫中的論文引用關系數據,構建論文的引用網絡,并實時計算引用網絡中各個論文的重要程度,處理生成JSON文件;
步驟3.2:利用D3.JS可視化工具,對讀取到的論文引用關系數據進行處理,將論文的引用網絡以及論文本身的各種信息動態地展現到網站系統中;
步驟3.3:通過對論文的重要程度以及其他相關論文到用戶關注論文的路徑長度信息的挖掘,過濾不重要的或用戶不關心的論文;
步驟3.4:提供用戶操作窗口,根據用戶的輸入信息搜索論文的學術族譜,找到所尋找的目標論文。
2.根據權利要求1所述的基于論文間引用關系的學術地圖展示方法,其特征在于,所述步驟1包括:
步驟1.1:使用互聯網上公開的論文數據集,導出論文之間的引用關系數據;
步驟1.2:根據構建的學術網絡圖內的論文之間的引用關系,用Apache Spark中的GraphX模塊來實現社區發現算法來對所有論文進行聚類處理;
所述聚類算法是指:將論文引用關系數據按照不同的類別進行劃分,構成為社區的結構;
所述社區發現算法是指:標簽傳遞法Label Propagation Algorithm,簡稱LPA,以及Louvain法;
標簽傳遞法是指:每個節點的標簽按相似度傳播給相鄰節點,在節點傳播的每一步,每個節點根據相鄰節點的標簽來更新本節點的標簽,與本節點相似度越大,則對應的相鄰節點對本節點標注的影響權值越大,若相鄰節點的標簽越趨于一致,則標簽就越容易傳播;
Louvain Method方法是指:網絡中的每個節點分配到對應各個節點的社區,對于節點分配鄰近的社區,若沒有模塊化增量,則節點所在社區位置不變;若存在模塊化有增量,則將節點加入到新的社區,當不存在模塊增量時,將在同一社區的所有節點合并,形成一個新的網絡;
步驟1.3:在聚類過程中,通過調整不斷地優化Louvain模塊和LPA的迭代次數,對比標簽傳遞法和Louvain法這兩種算法之間的結果與效率,選擇Louvain Method方法,得到劃分結果。
3.根據權利要求1所述的基于論文間引用關系的學術地圖展示方法,其特征在于,所述步驟4包括:
步驟4.1:將步驟1中得到的社區分類的結果處理成JSON文件以供網站前端使用;
步驟4.2:以步驟2中獲得的社區屬性或含義,以地圖縮放形式,多層次多角度地展示學術地圖;
步驟4.3:利用D3.JS可視化工具,提供動態地論文演變過程。
4.根據權利要求2所述的基于論文間引用關系的學術地圖展示方法,其特征在于,所述步驟1.3中的Louvain Modularity算法是基于模塊性的算法,在一個有權網絡中,模塊性的定義為:
式中:Q表示Louvain模塊化,Aij表示節點i與節點j之間的邊的權重,ki表示所有連接到節點i的邊的權重之和,ci表示當前節點i歸屬的社區,cj表示當前節點j歸屬的社區,m表示在網絡中的所有鏈接的權重的總和,其中,當函數δ(u,v)中的u等于v時,函數δ(u,v)的值為1,否則為0。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于上海交通大學,未經上海交通大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201610029065.8/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:推廣行為的檢測方法及裝置
- 下一篇:一種復習題目生成方法及裝置





