[發明專利]基于復雜網絡的學術核心作者挖掘及相關信息抽取方法和系統有效
| 申請號: | 201210592828.1 | 申請日: | 2012-12-31 |
| 公開(公告)號: | CN103020302A | 公開(公告)日: | 2013-04-03 |
| 發明(設計)人: | 陸浩;王飛躍;溫婉婷;甘潤生;孫星愷 | 申請(專利權)人: | 中國科學院自動化研究所 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 中科專利商標代理有限責任公司 11021 | 代理人: | 宋焰琴 |
| 地址: | 100190 *** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 復雜 網絡 學術 核心 作者 挖掘 相關 信息 抽取 方法 系統 | ||
技術領域
本發明涉及數據挖掘領域,尤其涉及一種基于復雜網絡的學術核心作者挖掘及相關信息抽取方法和系統。
背景技術
眾多實際網絡都有一個共同性質,即它們都是由各個社團通過公共節點連接而成網絡。社團內部節點間的連接相對緊密,社團間的連接相對稀疏。例如萬維網可以看成是由大量網站社團組成,同一社團內部的眾多站點討論的往往是有共同興趣的一些話題。類似地,在作者合作網或者電路網絡中,同樣可以將各個節點根據其不同的性質劃分為不同的社團。因此,網絡中社團的數目以及每個節點的歸屬社團及數目對復雜網絡的研究都具有重要意義。
對于網絡中的社團結構的定義,目前沒有一個公認的標準。因此網絡中社團結構定義的形式很多,但是大體上分為兩類:
1.使用節點對間邊的相對疏密程度來衡量社團結構。在這種方法定義下,每個社團內部的節點對間的連接相對緊密,但是各個社團之間的連接卻相對稀疏。
2.使用圖論中的精確數量指標來定義社團結構。這些社團結構都是由圖論中團的定義衍生而來。在這類結構的定義方式下,一般要求社團內部每個點都相鄰,或者至多可以與多少點不相鄰,或者任兩點之間最遠多少跳等等類似的方式。
當前領域專家識別推薦通常采用通過構造模糊文本分類器,對專家上傳到知識庫中的文檔進行模糊文本分類,結合數量、時間等因素建立專家知識模型的方法,這種方法存在所用文本庫不全,覆蓋面低,很難在多個領域進行全方位綜合分析所在領域專家的具體貢獻及相關個人信息,存在很大的局限性?;诖?,本發明使用復雜網絡分析技術中的復雜網絡構建、參數分析以及社團發現算法,可有效地用于學科領域核心人物或核心團體的發現與其相關信息的獲取。
發明內容
本發明針對挖掘某一學術領域核心人物及智能提取其相關信息的問題,本發明提出了一種基于社會網絡分析技術中的核心節點發現方法而改進的學術核心作者挖掘、信息抽取算法和系統。該方法和系統針對特定領域的文獻數據,使用復雜網絡分析技術中的復雜網絡構建、參數分析以及社團發現算法,高效率的找到領域核心團體或關鍵人物。
本發明提出的一種基于復雜網絡的學術核心作者挖掘及相關信息抽取方法,其包括:
步驟1、采用垂直搜索技術采集指定領域的文獻數據,并對所述文獻數據進行整理分析,以獲取作者相關信息;
步驟2、根據所獲取的作者相關信息抽取作者合作網絡,并統計作者相關的參數,根據所統計的不同相關參數獲得不同的作者排名信息;
步驟3、對所抽取的合作網絡進行社團劃分,劃分后的社團作為一個科研群體;
步驟4、向用戶展示所述不同的作者排名信息和科研群體,并根據用戶所選擇的作者排名信息和科研群體為用戶推薦核心作者和領袖團隊。
本發明還提出了一種基于復雜網絡的學術核心作者挖掘及相關信息抽取系統,其包括:
數據采集和整理裝置:用于采用垂直搜索技術采集指定領域的文獻數據,并對所述文獻數據進行整理分析,以獲取作者相關信息;
參數分析統計裝置:根據所獲取的作者相關信息抽取作者合作網絡,并統計作者相關的參數,根據所統計的不同相關參數獲得不同的作者排名信息;;
社團劃分裝置:對所抽取的合作網絡進行社團劃分,劃分后的社團作為一個科研群體;
結果展示裝置:向用戶展示所述不同的作者排名信息和科研群體,并根據用戶所選擇的作者排名信息和科研群體為用戶推薦核心作者和領袖團隊。
附圖說明
圖1是本發明的應用系統原理圖;
圖2是本發明的應用系統的簡單使用流程圖;
圖3是本發明中基于復雜網絡的學術核心作者挖掘及相關信息抽取方法的流程圖;
圖4是本發明中數據采集子流程圖;
圖5是本發明中數據采集配置子流程圖;
圖6是本發明中數據分析整理子流程圖;
圖7是本發明實現的應用系統截圖。
具體實施方式
為使本發明的目的、技術方案和優點更加清楚明白,以下結合具體實施例,并參照附圖,對本發明進一步詳細說明。
本發明所提出的基于復雜網絡的學術核心作者挖掘及相關信息抽取方法和系統是針對領域核心專家群體信息檢索而發明的,應用系統原理見附圖1。
下面介紹本發明所使用到的技術:
1、采集技術
1.1垂直搜索
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國科學院自動化研究所,未經中國科學院自動化研究所許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201210592828.1/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:牽引桿隨車存放箱
- 下一篇:潛伏式AGV物料車用雙向掛扣止退裝置





