[發明專利]一種基于海量知識網絡的學術社區系統有效
| 申請號: | 201110405541.9 | 申請日: | 2011-12-08 |
| 公開(公告)號: | CN102521337A | 公開(公告)日: | 2012-06-27 |
| 發明(設計)人: | 金海;趙峰;陳恒;吳步文;方飛;嚴奉偉;劉普 | 申請(專利權)人: | 華中科技大學 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 華中科技大學專利中心 42201 | 代理人: | 李智 |
| 地址: | 430074 湖北*** | 國省代碼: | 湖北;42 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 海量 知識 網絡 學術 社區 系統 | ||
技術領域
本發明屬于數據挖掘和信息檢索和海量數據處理交叉領域,具體涉及為一種以學術資源搜索、學術數據統計、學術相關服務及學術社區為特色的學術社區系統。
背景技術
隨著全球信息化的逐漸發展深入,越來越多的學術資源發布到網絡。然而由于這些資源分散在全球各處,既繁多又繁雜,而且還在逐年以指數增長。如何從如此繁多的學術資源中獲取想要的資源是一個棘手的問題。
傳統的搜索由于面向的是整個互聯網,搜索的結果會非常寬泛,不能很好的為科研工作者提供搜索服務。在此背景下產生了專門針對學術資源的搜索。學術搜索專為解決面向學術文獻資源的搜索,它的定位不同于通用搜索,而是專注于學術資源的。
然而目前的學術搜索系統有以下問題:1、主要專注于科技文獻的搜索,即給出按文獻標題的搜索、按作者的搜索等,服務單一,不夠豐富和多元化。2、目前大多數的學術搜索系統所索引的科技文獻是人工添加的,而非自動從網絡中獲取的,沒有充分利用網絡上的豐富資源。3、目前大多數的學術搜索系統對各種學術資源沒能整合、沒有形成完整的知識網絡,以統一對外服務。4、目前的學術搜索系統缺乏與用戶的交互,不能充分發揮用戶的主動能動性。
這四點都制約了目前的學術搜索的服務,使其不能很好的滿足科研工作者各種與學術相關的服務需求。
發明內容
本發明的目的是為了克服現有學術搜索系統的制約,提供了一種基于海量知識網絡的學術社區系統,充分利用網絡資源形成知識網絡,提供了更多的搜索和服務功能以及用戶與知識庫交互的接口。
一種基于海量知識網絡的學術社區系統,包括
信息收集與存儲模塊9,用于收集網絡和用戶提供的信息形成知識網絡;學術檢索模塊10,用于在所述知識網絡中對會議、文獻、作者和領域綜述進行檢索;學術服務模塊11,用于利用所述知識網絡服務用戶的個性需求;社區模塊8,用于用戶之間以及用戶與知識網絡之間的信息交互。
所述信息收集與存儲模塊9包括公共數據收集模塊9.1,用于收集互聯網上的學術信息,所述學術信息包括會議、科技文獻和作者信息;多個私有數據收集模塊9.2,用于收集各對應用戶的私有信息和用戶分享的學術信息;知識網絡組建模塊9.3,用于對公共數據模塊9.1收集的互聯網學術信息和私有數據模塊9.2收集的用戶分享的學術信息進行整體分析,挖掘出關聯關系,形成知識網絡。
所述公共數據模塊9.1包括會議信息爬取模塊9.1A,用于定期的從網絡識別和下載包含會議信息的網頁;科技文獻爬取模塊9.1B,用于定期的從網絡識別和下載文獻列表網頁;作者信息爬取模塊9.1C,用于定期從網絡中識別和下載個人主頁;信息抽取和整合模塊9.1D,用于從上述三爬取模塊爬取的網頁中抽取有用信息,并對所述有用信息進行去除冗余、錯誤數據剔除及信息整合。
所述學術檢索模塊10包括文獻檢索模塊1,用于定期從知識網絡中獲取文獻信息,接收用戶文獻查詢請求,將文獻查詢結果按照相似度的高低排序后反饋給用戶;會議檢索模塊2,用于定期從知識網絡中獲取會議信息,接收用戶會議查詢請求,將會議查詢結果按照會議時間排序后反饋給用戶;作者檢索模塊3,用于定期從知識網絡中獲取作者信息,接收用戶作者查詢請求,對作者查詢結果進行同名作者區分后反饋給用戶;領域綜述模塊4,用于定期從所述知識網絡中獲取文獻信息,從中抽取文獻內容,依據文獻內容對文獻分類,并計算文獻的綜合影響分子;接收用戶的領域查詢請求,確定其所述領域,將確定的領域內的所有文獻按照綜合影響因子高低排序,選取排序靠前的部分文獻進行自然語言分析處理生成綜述。
所述學術服務模塊11包括格式轉換模塊5,用于上傳用戶提供的初稿至所述信息收集與存儲模塊9,抽取初稿各單元內容,調用用戶選定的格式模板對抽取的單元內容作格式轉換;自動摘要服務模塊6,用于上傳用戶提供的科技文獻至所述信息收集與存儲模塊9,確定上傳的科技文獻的文件格式,調用文件格式對應的文獻抽取工具抽取其全文信息,依據全文信息生成摘要;投稿推薦服務模塊7,用于上傳用戶的投稿至所述信息收集與存儲模塊9,從所述知識網絡獲取會議信息,對所述會議信息進行語義分詞,依據分詞結果對會議創建索引從而建立會議索引文件,挖掘所述投稿的主題信息,以主題信息作為索引詞,所述會議索引文件作為查詢源查詢出推薦會議反饋給用戶。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于華中科技大學,未經華中科技大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201110405541.9/2.html,轉載請聲明來源鉆瓜專利網。





