[發明專利]一種基于FP-Growth算法的試題知識點分析方法在審
| 申請號: | 201810465713.3 | 申請日: | 2018-05-16 |
| 公開(公告)號: | CN108804543A | 公開(公告)日: | 2018-11-13 |
| 發明(設計)人: | 陸璐;廖飛 | 申請(專利權)人: | 華南理工大學 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 廣州市華學知識產權代理有限公司 44245 | 代理人: | 陳宏升 |
| 地址: | 510640 廣*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 算法 試題 知識點 減小搜索空間 離散化處理 數據預處理 關聯規則 結果數據 頻繁項集 運行效率 復雜度 關聯性 數據集 迭代 獲知 減小 改進 分析 合并 學生 | ||
本發明公開了一種基于FP?Growth算法的試題知識點分析方法,包括以下步驟:首先獲取學生的試題作答結果數據并進行數據預處理,同時結合項合并策略對傳統FP?Growth算法進行改進,接著運用改進的FP?Growth算法對離散化處理后的數據集進行迭代,最終得到各個作答試題之間的關聯性規則,進而對應獲知試題知識點之間的關聯規則。本發明減小了樹的復雜度,大幅度減小搜索空間的規模,同時也減少了頻繁項集的產生,達到提高算法運行效率的目的。
技術領域
本發明涉及信息化、數學化教育領域,特別涉及一種基于FP-Growth算法的試題知識點分析方法。
背景技術
近年來,隨著移動互聯網的迅速發展以及云計算帶動的大數據時代新“浪潮”,我國教育信息化建設開始進入效益發揮的應用發展關鍵期。在現代教學過程中,考試作為其中重要的一環,仍是檢驗學生學習成果、反饋教師教學情況的重要手段之一。從教育評價方面看,大量試卷試題作答數據很好的為教育大數據分析提供了基礎,試卷作為考核評價學生最有效的方式之一的載體,也能實時收集學生作答反饋的大量相關數據信息。另一方面,試卷分析作為幫助了解教學效果、確定是否達到預期目的和要求的有效途徑,是伴隨著考試過程中不可或缺的一部分。如何挖掘隱藏于其中的巨大價值信息并加以有效利用,為教學過程提供科學指導與科學依據,提高教學管理水平,是現代教學發展過程中亟待解決的問題。
現實世界中數據大體上都是不完整,不一致的臟數據,無法直接進行數據挖掘,或挖掘結果差強人意。為了提高數據挖掘的質量產生了數據預處理技術。這些數據處理技術在數據挖掘之前使用,大大提高了數據挖掘模式的質量,降低實際挖掘所需要的時間。數據預處理有多種方法:數據清洗指的是對數據進行重新審查和校驗的過程,目的在于刪除重復信息、糾正存在的錯誤,并提供數據一致性;數據有效性分析是指排除一些對后續數據分析產生干擾的因素,以確保后期結果的可靠性;數據離散化處理是程序設計中一個常用的技巧,它可以有效的降低時間復雜度,其基本思想就是在眾多可能的情況中,只考慮需要用的值。
從大規模數據集中尋找項與項之間可能存在的相關聯系被稱作關聯分析(association analysis)或者關聯規則學習(association rule learning)。關聯規則是形如X→Y的蘊涵式,其中,X和Y分別稱為關聯規則的先導和后繼。關聯規則最初提出的動機是針對購物籃分析(Market Basket Analysis)問題提出的,由于可以發現以往數據分析與統計方法無法得到的數據之間隱藏的關聯規律,因此關聯規則的探究一直以來都受到領域內眾多學者專家的重視,其研究價值的重要性不言而喻。關聯規則分析如今在商業、醫療、金融、保險、教育、氣象觀測、證券和工業制造等領域得到了廣泛的應用。
FP-Growth算法是韓家煒等人在2000年提出的關聯分析算法,它采取如下分治策略:在算法中使用了一種稱為頻繁模式樹(Frequent Pattern Tree)的數據結構。將提供頻繁項集的數據庫壓縮到一棵頻繁模式樹(FP-tree),但仍保留項集關聯信息。FP-tree是一種特殊的前綴樹,由頻繁項頭表和項前綴樹構成。FP-Growth算法基于以上的結構加快整個挖掘過程。實驗表明,FP-growth對不同長度的規則都有很好的適應性,同時在效率上較經典的關聯規則算法Apriori算法有巨大的提高。
FP-Growth算法可以通過項合并策略進行改進優化。項合并策略的理論依據如下:如果包含頻繁項集X的每個事務中都包含頻繁項集Y,但不包含頻繁項集Y的任何超集,則X∪Y形成一個閉頻繁項集,并且不必再搜素包含X但不包含Y的任何項集。
發明內容
本發明的主要目的在于克服現有技術的缺點與不足,提供一種基于FP-Growth算法的試題知識點分析方法,通過項合并策略改進傳統FP-Growth算法,提供一種挖掘考試試題中知識點間關聯性的分析方法。
本發明的目的通過以下的技術方案實現:
一種基于FP-Growth算法的試題知識點分析方法,包括以下步驟:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于華南理工大學,未經華南理工大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810465713.3/2.html,轉載請聲明來源鉆瓜專利網。





