[發(fā)明專利]一種基于ElasticSearch對MOOC課程進行分面檢索的方法在審
| 申請?zhí)枺?/td> | 201611074980.5 | 申請日: | 2016-11-29 |
| 公開(公告)號: | CN106776878A | 公開(公告)日: | 2017-05-31 |
| 發(fā)明(設計)人: | 劉均;石磊;魏筆凡;王萌;姚思雨;曾宏偉;郭朝彤;王瑞杰 | 申請(專利權)人: | 西安交通大學 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30;G06Q50/20 |
| 代理公司: | 西安通大專利代理有限責任公司61200 | 代理人: | 陸萬壽 |
| 地址: | 710049 陜*** | 國省代碼: | 陜西;61 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 elasticsearch mooc 課程 進行 檢索 方法 | ||
技術領域
本發(fā)明涉及一種對MOOC課程進行檢索的方法,具體涉及一種基于ElasticSearch對MOOC課程進行分面檢索的方法。
背景技術
MOOC中國作為至關重要的教育合作平臺,將帶領中國遠程教育走向國際舞臺。MOOC中國與絲路學院的結合,將成為互聯(lián)網(wǎng)+教育的全新模式,以嶄新的技術、資源、商業(yè)和服務理念和手段,實現(xiàn)網(wǎng)絡教育的轉型升級,實現(xiàn)中國的網(wǎng)絡教育走向世界。
ElasticSearch是一個基于Lucene的搜索服務器。它提供了一個分布式多用戶能力的全文搜索引擎,基于RESTful web接口。ElasticSearch是用Java開發(fā)的,其設計用于云計算中,能夠達到實時搜索,穩(wěn)定,可靠,快速,安裝使用方便,并作為Apache許可條款下的開放源碼發(fā)布,是當前流行的企業(yè)級搜索引擎。
現(xiàn)有國內外MOOC平臺中,課程檢索主要包括三個步驟:(1)對課程名稱的索引;(2)用戶在MOOC網(wǎng)站對課程名稱進行檢索;(3)MOOC檢索系統(tǒng)直接返回數(shù)據(jù)。
上述方法中的索引內容不夠全面,檢索方式單一,檢索結果輸出不夠智能。因此,這種大眾化的檢索方式并不能滿足用戶更全面的需求。
發(fā)明內容
為了解決現(xiàn)有技術中的問題,本發(fā)明提出一種基于ElasticSearch對MOOC課程進行分面檢索的方法,將繁雜、無序的課程資源整合成一個可個性化高效搜索的形式,緩解用戶搜索所需課程信息慢的弊端,提高用戶獲得有效信息的精準度,使用戶能夠檢索更全面的內容,更快檢索到想要的課程。
為了實現(xiàn)以上目的,本發(fā)明所采用的技術方案為:包括以下步驟:
1)元數(shù)據(jù)的獲取:首先從MOOC資源服務平臺獲取MOOC課程元數(shù)據(jù),然后解析數(shù)據(jù)并將MOOC課程元數(shù)據(jù)存儲在本地資源數(shù)據(jù)庫中;
2)索引構建:首先在ElasticSearch中創(chuàng)建一個索引,然后通過ElasticSearch的批量導入機制,將本地資源數(shù)據(jù)庫中的MOOC課程元數(shù)據(jù)在ElasticSearch集群中建立索引;
3)多字段檢索和字段權重設置:首先根據(jù)MOOC課程資源的特點分析出若干個字段的數(shù)據(jù)并加入到待檢索字段中,然后利用ElasticSearch的Bool查詢嵌套,實現(xiàn)多字段檢索;最后對不同字段通過設置不同的權重,排除檢索結果中的干擾信息;
4)分面檢索和查詢結果排序:首先設置若干個分面,利用ElasticSearch的聚合查詢從不同分面對MOOC課程進行篩選和過濾,允許用戶創(chuàng)建自己的檢索路徑,實現(xiàn)分面檢索;然后設置排序,在MOOC課程檢索結果的基礎上按照一個特定分面進行排序,使具有預期屬性的MOOC課程盡可能靠前,完成檢索結果排序;
5)設置檢索服務接口,提供MOOC課程檢索服務,檢索服務接口要求用戶提供檢索關鍵詞和檢索分面信息,用戶提供檢索關鍵詞和檢索分面信息后,檢索服務接口向用戶返回MOOC課程信息列表以及課程分面聚合結果。
所述步驟1)中元數(shù)據(jù)的獲取具體包括以下步驟:
1.1)通過基于HTTP協(xié)議的GET請求規(guī)范從MOOC中國資源服務平臺獲取課程列表;
1.2)將所有課程的CourseID放入隊列中進行循環(huán)遍歷,根據(jù)CourseID這個字段通過基于HTTP協(xié)議的GET請求規(guī)范從MOOC中國資源服務平臺獲取每一課程的JSON文件;
1.3)利用JsonPath解析語法,對JSON文件進行解析,獲取MOOC課程元數(shù)據(jù);
1.4)將MOOC課程元數(shù)據(jù)存入本地的MySQL資源數(shù)據(jù)庫中。
所述步驟2)中索引構建具體包括:首先構建ElasticSearch的Mapping描述文件,指明每一個字段如何索引數(shù)據(jù)以及是否被檢索到,并使用一個默認的分析器Analyzer;然后將Mapping文件寫入ElasticSearch集群中,創(chuàng)建一個索引Indexmooc;最后從本地MySQL資源數(shù)據(jù)庫中獲取MOOC課程元數(shù)據(jù),利用ElasticSearch的Bulk批量導入索引Indexmooc中。
所述步驟3)中多字段檢索和字段權重設置具體包括以下步驟:
3.1)根據(jù)MOOC課程資源的特點分析出七個字段的數(shù)據(jù),七個字段包括課程名稱CourseName、課程簡介Introduction、課程機構名稱OrgName、章節(jié)列表Chapterlist、教師團隊TeacherInfo、先修知識Priorknowledge和授課語言Language;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于西安交通大學,未經(jīng)西安交通大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201611074980.5/2.html,轉載請聲明來源鉆瓜專利網(wǎng)。
- 上一篇:摩托車零件型號自動識別方法
- 下一篇:一種客戶繳費服務信息推送方法
- 基于Elasticsearch的DSL查詢方法
- 一種基于mongo數(shù)據(jù)庫的搜索系統(tǒng)
- 一種基于Presto和Elasticsearch的SQL查詢方法
- 一種基于Elasticsearch的數(shù)據(jù)處理方法及終端
- 一種Kafka與Elasticsearch數(shù)據(jù)庫數(shù)據(jù)的互相遷移方法
- 一種Elasticsearch數(shù)據(jù)查詢方法及系統(tǒng)
- 一種基于Elasticsearch的數(shù)據(jù)檢索方法、裝置、設備、介質
- 基于條件下推elasticsearch的hive索引方法
- 一種Elasticsearch索引的加載方法、裝置、計算機設備和存儲介質
- Elasticsearch搜索引擎的索引創(chuàng)建方法及裝置





