[發(fā)明專利]一種主題自適應(yīng)的學(xué)術(shù)會議搜索系統(tǒng)有效
| 申請?zhí)枺?/td> | 201310003000.2 | 申請日: | 2013-01-05 |
| 公開(公告)號: | CN103049575A | 公開(公告)日: | 2013-04-17 |
| 發(fā)明(設(shè)計(jì))人: | 金海;趙峰;孫正;聶昶 | 申請(專利權(quán))人: | 華中科技大學(xué) |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 華中科技大學(xué)專利中心 42201 | 代理人: | 朱仁玲 |
| 地址: | 430074 湖北*** | 國省代碼: | 湖北;42 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 主題 自適應(yīng) 學(xué)術(shù)會議 搜索 系統(tǒng) | ||
技術(shù)領(lǐng)域
本發(fā)明屬于信息檢索、信息抽取、文本挖掘領(lǐng)域,更具體地,涉及一種主題自適應(yīng)的學(xué)術(shù)會議搜索系統(tǒng)。
背景技術(shù)
隨著學(xué)術(shù)交流的舉辦愈加頻繁,全球?qū)W術(shù)會議及學(xué)術(shù)期刊的數(shù)量逐年激增。對于科研工作者而言,如何方便快捷地從眾多的學(xué)術(shù)會議和學(xué)術(shù)期刊中找到與自己的研究領(lǐng)域相吻合的會議或期刊,進(jìn)而查閱相關(guān)的文獻(xiàn)用以參考;又或者如何從海量的學(xué)術(shù)會議及學(xué)術(shù)期刊中選擇適合自己論文投稿的會議或期刊,以增加錄用的概率,已然成為科研工作者十分關(guān)心的問題。
現(xiàn)有的科技文獻(xiàn)檢索引擎基本上采用的都是基于關(guān)鍵字的全文檢索方式來響應(yīng)用戶的查詢請求,而且其主要檢索對象大部分都是定位在科技文獻(xiàn)上,對于學(xué)術(shù)會議的檢索支持很少甚至沒有。例如,Google?Scholar、ACM數(shù)據(jù)庫、IEEE數(shù)字圖書館、中國知識資源總庫CNKI,大多沒有專門針對學(xué)術(shù)會議提供檢索服務(wù),更沒有對學(xué)術(shù)會議的主題信息進(jìn)行深度挖掘。此外,通過對科研工作者的論文進(jìn)行文本挖掘進(jìn)而達(dá)到主題發(fā)現(xiàn)的目的,以實(shí)現(xiàn)主題自適應(yīng)的投稿推薦服務(wù)在現(xiàn)有的科技文獻(xiàn)平臺中還鮮有見過。
發(fā)明內(nèi)容
針對現(xiàn)有技術(shù)的缺陷,本發(fā)明的目的在于提供一種主題自適應(yīng)的學(xué)術(shù)會議搜索系統(tǒng),該系統(tǒng)可以為用戶提供主題自適應(yīng)的學(xué)術(shù)會議檢索服務(wù)以及主題自適應(yīng)的個(gè)性化投稿推薦服務(wù),以解決現(xiàn)有科技文獻(xiàn)檢索引擎存在的弊端,如檢索不靈活,只能按關(guān)鍵字匹配等,在主題自適應(yīng)的學(xué)術(shù)會議檢索服務(wù)中,用戶可以通過研究領(lǐng)域主題關(guān)鍵字來檢索到相關(guān)的學(xué)術(shù)會議,與傳統(tǒng)的科技文獻(xiàn)檢索引擎相比,該系統(tǒng)可以根據(jù)關(guān)鍵詞進(jìn)行主題自適應(yīng)的相關(guān)性判定過程,并且具有更強(qiáng)的專業(yè)性、更高的精確性和權(quán)威性。
為實(shí)現(xiàn)上述目的,本發(fā)明提供了一種主題自適應(yīng)的學(xué)術(shù)會議搜索系統(tǒng),包括數(shù)據(jù)采集模塊、主題發(fā)現(xiàn)模塊、數(shù)據(jù)處理模塊以及用戶接口模塊,用戶接口模塊包括學(xué)術(shù)會議搜索接口子模塊以及個(gè)性化投稿推薦接口子模塊,數(shù)據(jù)采集模塊包括網(wǎng)絡(luò)爬蟲子模塊和數(shù)據(jù)存儲子模塊,主題發(fā)現(xiàn)模塊包括網(wǎng)頁信息抽取子模塊、文本抽取子模塊以及文本挖掘子模塊,數(shù)據(jù)處理模塊包括數(shù)據(jù)庫子模塊、索引子模塊、學(xué)術(shù)會議評價(jià)子模塊以及檢索子模塊,網(wǎng)絡(luò)爬蟲子模塊用于從公開免費(fèi)的信息源爬取包含學(xué)術(shù)會議和/或期刊信息的網(wǎng)頁,數(shù)據(jù)存儲子模塊用于將網(wǎng)絡(luò)爬蟲子模塊爬取的網(wǎng)頁以文件的形式存儲在本地,網(wǎng)頁信息抽取子模塊用于從爬取的網(wǎng)頁中抽取出學(xué)術(shù)會議和/或期刊的信息并存儲在文件中,個(gè)性化投稿推薦接口子模塊用于接收用戶上傳的論文文檔,并將其傳遞給文本抽取子模塊,文本抽取子模塊用于解析來自個(gè)性化投稿推薦接口子模塊的論文文檔,以獲取文檔內(nèi)容的文本信息,并將文本信息傳遞給文本挖掘子模塊,文本挖掘子模塊用于對文本抽取子模塊獲取的文本信息進(jìn)行文本挖掘,以獲取主題信息,并將主題信息傳給檢索子模塊,數(shù)據(jù)庫子模塊用于將網(wǎng)頁信息抽取子模塊抽取到的學(xué)術(shù)會議和/或期刊信息存儲到數(shù)據(jù)庫中,索引子模塊用于利用開源全文檢索引擎工具包為存儲在數(shù)據(jù)庫中的學(xué)術(shù)會議和/或期刊信息構(gòu)建索引,學(xué)術(shù)會議評價(jià)子模塊用于計(jì)算學(xué)術(shù)會議和/或期刊的等級值,學(xué)術(shù)會議搜索接口子模塊用于接收用戶輸入的搜索關(guān)鍵詞,并將其傳遞給檢索子模塊,檢索子模塊用于從學(xué)術(shù)會議搜索接口子模塊接收搜索關(guān)鍵詞,利用開源全文檢索引擎工具包對該搜索關(guān)鍵詞進(jìn)行解析,根據(jù)解析結(jié)果在索引子模塊構(gòu)建的索引中進(jìn)行檢索以獲取對應(yīng)的學(xué)術(shù)會議和/或期刊信息作為檢索結(jié)果,根據(jù)學(xué)術(shù)會議評價(jià)子模塊計(jì)算的等級值對檢索結(jié)果進(jìn)行排序,并將排序結(jié)果傳送給學(xué)術(shù)會議搜索接口子模塊,檢索子模塊還用于接收來自文本挖掘子模塊的主題信息,利用開源全文檢索引擎工具包對該主題信息進(jìn)行解析,根據(jù)解析結(jié)果在索引子模塊構(gòu)建的索引中進(jìn)行檢索以獲取對應(yīng)的學(xué)術(shù)會議和/或期刊信息作為檢索結(jié)果,根據(jù)學(xué)術(shù)會議評價(jià)子模塊計(jì)算的等級值對檢索結(jié)果進(jìn)行排序,并將排序結(jié)果傳送給個(gè)性化投稿推薦接口子模塊,學(xué)術(shù)會議搜索接口子模塊還用于將來自于檢索子模塊的排序結(jié)果以可視化的形式呈現(xiàn)在Web頁面上,供用戶查閱,個(gè)性化投稿推薦接口子模塊還用于將來自于檢索子模塊的排序結(jié)果以可視化的形式呈現(xiàn)在Web頁面上,供用戶查閱。
網(wǎng)絡(luò)爬蟲子模塊利用HttpClient開源Jar包實(shí)現(xiàn)對信息源的統(tǒng)一資源標(biāo)識符進(jìn)行特征分析,以判斷該信息源中是否包括學(xué)術(shù)會議和/或期刊信息。
網(wǎng)頁信息抽取子模塊利用HtmlParser開源Jar包實(shí)現(xiàn)信息的抽取,信息具體包括標(biāo)題、舉辦時(shí)間、舉辦地點(diǎn)、投稿日期、會議主題。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于華中科技大學(xué),未經(jīng)華中科技大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201310003000.2/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 上一篇:物流信息追蹤裝置
- 下一篇:一種手持式物流收件信息采集裝置
- 同類專利
- 專利分類
G06F 電數(shù)字?jǐn)?shù)據(jù)處理
G06F17-00 特別適用于特定功能的數(shù)字計(jì)算設(shè)備或數(shù)據(jù)處理設(shè)備或數(shù)據(jù)處理方法
G06F17-10 .復(fù)雜數(shù)學(xué)運(yùn)算的
G06F17-20 .處理自然語言數(shù)據(jù)的
G06F17-30 .信息檢索;及其數(shù)據(jù)庫結(jié)構(gòu)
G06F17-40 .數(shù)據(jù)的獲取和記錄
G06F17-50 .計(jì)算機(jī)輔助設(shè)計(jì)
- 使用后向自適應(yīng)規(guī)則進(jìn)行整數(shù)數(shù)據(jù)的無損自適應(yīng)Golomb/Rice編碼和解碼
- 一種自適應(yīng)軟件UML建模及其形式化驗(yàn)證方法
- 媒體自適應(yīng)參數(shù)的調(diào)整方法、系統(tǒng)及相關(guān)設(shè)備
- 五自由度自適應(yīng)位姿調(diào)整平臺
- 采用自適應(yīng)機(jī)匣和自適應(yīng)風(fēng)扇的智能發(fā)動(dòng)機(jī)
- 一種自適應(yīng)樹木自動(dòng)涂白裝置
- 一種基于微服務(wù)的多層次自適應(yīng)方法
- 一種天然氣發(fā)動(dòng)機(jī)燃?xì)庾赃m應(yīng)控制方法及系統(tǒng)
- 一種中心自適應(yīng)的焊接跟蹤機(jī)頭
- 一種有砟軌道沉降自適應(yīng)式軌道系統(tǒng)
- 基于Windows系統(tǒng)的自動(dòng)識別起止的會議報(bào)告計(jì)時(shí)器及計(jì)時(shí)方法
- 一種主題自適應(yīng)的學(xué)術(shù)會議搜索系統(tǒng)
- 一種學(xué)術(shù)論文高效分配方法
- 一種幻燈片管理系統(tǒng)
- 一種學(xué)術(shù)會議移動(dòng)互聯(lián)網(wǎng)技術(shù)方案及其實(shí)現(xiàn)方法
- 基于人臉識別的智能會議排座系統(tǒng)
- 電子教鞭
- 一種基于混合推薦算法的學(xué)術(shù)會議推薦系統(tǒng)
- 一種面向?qū)W者的用戶畫像構(gòu)建及應(yīng)用方法
- 用于學(xué)術(shù)會議的學(xué)術(shù)報(bào)告管理方法和管理系統(tǒng)





