[發明專利]一種基于ElasticSearch對MOOC課程進行分面檢索的方法在審
| 申請號: | 201611074980.5 | 申請日: | 2016-11-29 |
| 公開(公告)號: | CN106776878A | 公開(公告)日: | 2017-05-31 |
| 發明(設計)人: | 劉均;石磊;魏筆凡;王萌;姚思雨;曾宏偉;郭朝彤;王瑞杰 | 申請(專利權)人: | 西安交通大學 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30;G06Q50/20 |
| 代理公司: | 西安通大專利代理有限責任公司61200 | 代理人: | 陸萬壽 |
| 地址: | 710049 陜*** | 國省代碼: | 陜西;61 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 elasticsearch mooc 課程 進行 檢索 方法 | ||
1.一種基于ElasticSearch對MOOC課程進行分面檢索的方法,其特征在于,包括以下步驟:
1)元數據的獲取:首先從MOOC資源服務平臺獲取MOOC課程元數據,然后解析數據并將MOOC課程元數據存儲在本地資源數據庫中;
2)索引構建:首先在ElasticSearch中創建一個索引,然后通過ElasticSearch的批量導入機制,將本地資源數據庫中的MOOC課程元數據在ElasticSearch集群中建立索引;
3)多字段檢索和字段權重設置:首先根據MOOC課程資源的特點分析出若干個字段的數據并加入到待檢索字段中,然后利用ElasticSearch的Bool查詢嵌套,實現多字段檢索;最后對不同字段通過設置不同的權重,排除檢索結果中的干擾信息;
4)分面檢索和查詢結果排序:首先設置若干個分面,利用ElasticSearch的聚合查詢從不同分面對MOOC課程進行篩選和過濾,允許用戶創建自己的檢索路徑,實現分面檢索;然后設置排序,在MOOC課程檢索結果的基礎上按照一個特定分面進行排序,使具有預期屬性的MOOC課程盡可能靠前,完成檢索結果排序;
5)設置檢索服務接口,提供MOOC課程檢索服務,檢索服務接口要求用戶提供檢索關鍵詞和檢索分面信息,用戶提供檢索關鍵詞和檢索分面信息后,檢索服務接口向用戶返回MOOC課程信息列表以及課程分面聚合結果。
2.根據權利要求1所述的一種基于ElasticSearch對MOOC課程進行分面檢索的方法,其特征在于,所述步驟1)中元數據的獲取具體包括以下步驟:
1.1)通過基于HTTP協議的GET請求規范從MOOC中國資源服務平臺獲取課程列表;
1.2)將所有課程的CourseID放入隊列中進行循環遍歷,根據CourseID這個字段通過基于HTTP協議的GET請求規范從MOOC中國資源服務平臺獲取每一課程的JSON文件;
1.3)利用JsonPath解析語法,對JSON文件進行解析,獲取MOOC課程元數據;
1.4)將MOOC課程元數據存入本地的MySQL資源數據庫中。
3.根據權利要求1所述的一種基于ElasticSearch對MOOC課程進行分面檢索的方法,其特征在于,所述步驟2)中索引構建具體包括:首先構建ElasticSearch的Mapping描述文件,指明每一個字段如何索引數據以及是否被檢索到,并使用一個默認的分析器Analyzer;然后將Mapping文件寫入ElasticSearch集群中,創建一個索引Indexmooc;最后從本地MySQL資源數據庫中獲取MOOC課程元數據,利用ElasticSearch的Bulk批量導入索引Indexmooc中。
4.根據權利要求1所述的一種基于ElasticSearch對MOOC課程進行分面檢索的方法,其特征在于,所述步驟3)中多字段檢索和字段權重設置具體包括以下步驟:
3.1)根據MOOC課程資源的特點分析出七個字段的數據,七個字段包括課程名稱CourseName、課程簡介Introduction、課程機構名稱OrgName、章節列表Chapterlist、教師團隊TeacherInfo、先修知識Priorknowledge和授課語言Language;
3.2)設置ElasticSearch的查詢器TermQuery和MatchQuery,并用ElasticSearch的Bool查詢進行嵌套,實現多字段檢索;
3.3)設置不同字段的權重,引入權重公式ω=CourseName×1.0+Introduction×ω1+OrgName×ω2+Chapterlist×ω3+TeacherInfo×ω4+Priorknowledge×ω5+Language×ω6;其中MOOC課程名稱CourseName的系數為1.0,其他字段系數ω1、ω2、ω3、ω4、ω5和ω6為待定系數。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于西安交通大學,未經西安交通大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201611074980.5/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:摩托車零件型號自動識別方法
- 下一篇:一種客戶繳費服務信息推送方法





