[發明專利]一種基于教育數據挖掘的學生成績早期預警方法及系統有效
| 申請號: | 201810917660.4 | 申請日: | 2018-08-13 |
| 公開(公告)號: | CN109242149B | 公開(公告)日: | 2021-08-13 |
| 發明(設計)人: | 杜旭;楊宗凱;楊娟;張明焱 | 申請(專利權)人: | 華中師范大學 |
| 主分類號: | G06Q10/04 | 分類號: | G06Q10/04;G06Q50/20 |
| 代理公司: | 北京金智普華知識產權代理有限公司 11401 | 代理人: | 楊采良 |
| 地址: | 430079 湖*** | 國省代碼: | 湖北;42 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 教育 數據 挖掘 學生 成績 早期 預警 方法 系統 | ||
1.一種基于教育數據挖掘的學生成績早期預警方法,其特征在于,所述基于教育數據挖掘的學生成績早期預警方法利用從在線學習平臺采集的學習行為數據以及從教務管理系統采集的學生的基本統計數據和成績數據;
再基于多層感知機multilayer perceptron算法和基于信息增益率的C4.5決策樹算法,構建兩階段的預測模型;
再形成最終的學習成績的早期預警模型;
其中第一階段分別構建success預測模型和fail預測模型;第一階段的success模型輸出的學生考試通過概率、fail模型輸出的學生考試失敗概率以及根據兩者的和生成的衍生變量,均用于第二階段預測模型的構建;
所述基于教育數據挖掘的學生成績早期預警方法具體包括:
步驟一:數據獲取:
在數據獲取的階段,需要根據特定的在線學習平臺對學習行為數據的記錄特性,選取某一范圍內學生的學習行為數據,并從教務管理系統中獲取相應的這些學生的基本統計數據和成績數據;
第一階段的success模型和fail模型是根據不同的在線學習平臺所能夠收集的學習行為特征作為輸入特征,收集某一門課程的學習者在多個在線學習平臺上的學習行為特征作為模型輸入,該門課程的期末考試成績為模型的輸出,模型在訓練過程中,利用神經網絡的前向傳播過程所得的預測值,得到預測值和真實值的損失值,并利用隨機梯度下降算法,將參數的梯度更新量迅速地反向傳播用于更新參數,多次迭代直至目標優化函數達到最優,進行預測模型的參數訓練;
第一階段預測模型都訓練完成后,分別得到success模型對學生考試通過的預測概率值,記為Ps;以及fail模型對學生考試失敗的預測概率值,記為Pr;
步驟二:數據預處理:
進行數據清洗、類別型變量的處理、數值型變量的處理及成績信息的處理;
所述數據清洗:刪除原始數據集中的無關數據或重復數據,并處理缺失數據;
所述類別型變量的處理:先對取值較多的類別型變量進行一定規則的類別壓縮,再進行獨熱編碼;
所述數值型變量的處理:采用最大-最小規范化處理,將數據映射到[0,1]之間;
或采用零均值規范化處理,使處理后的數據滿足均值為0,標準差為1的分布;
所述成績信息的處理:根據真實的成績信息,再按照特定教育情境下考試是否通過的規則定義,將成績映射為通過類別和失敗類別;
步驟三:數據集的劃分:
根據交叉驗證的思想對預處理后的數據集進行劃分,同時在劃分時基于成績字段的少數類別取值進行分層抽樣,形成訓練集和驗證集,分別用于各個階段的預測模型的訓練和預測效果驗證;
步驟四:第一階段的預測模型:
基于多層感知機算法構建success預測模型和fail預測模型,根據訓練好的兩個模型相應得到樣本集中所有學生考試會通過的概率和會失敗的概率,分別得到success模型對學生考試通過的預測概率值,記為Ps;以及fail模型對學生考試失敗的預測概率值,記為Pr;
步驟五:第二階段的預測模型:
基于前一階段的success預測模型和fail預測模型的各自輸出預測概率值Ps和Pr,以及Psum作為每一個樣本新的輸入特征,真實的期末考試成績所得的fail標記信息為輸出特征,再基于C4.5決策樹分別計算這3個輸入屬性的信息增益率,選擇信息增益率最高的屬性作為最佳的決策樹劃分屬性,從而構建第二階段的學生成績預測模型;
步驟六:結果預測:
通過兩階段的預測模型的構建以及各自在驗證集上的評估結果的定量分析;對新樣本進行和訓練/驗證數據一樣的預處理操作;然后將預處理后的數據送到已訓練好的兩階段的成績預警模型中,最終得到對該樣本的預測結果。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于華中師范大學,未經華中師范大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810917660.4/1.html,轉載請聲明來源鉆瓜專利網。
- 同類專利
- 專利分類
G06Q 專門適用于行政、商業、金融、管理、監督或預測目的的數據處理系統或方法;其他類目不包含的專門適用于行政、商業、金融、管理、監督或預測目的的處理系統或方法
G06Q10-00 行政;管理
G06Q10-02 .預定,例如用于門票、服務或事件的
G06Q10-04 .預測或優化,例如線性規劃、“旅行商問題”或“下料問題”
G06Q10-06 .資源、工作流、人員或項目管理,例如組織、規劃、調度或分配時間、人員或機器資源;企業規劃;組織模型
G06Q10-08 .物流,例如倉儲、裝貨、配送或運輸;存貨或庫存管理,例如訂貨、采購或平衡訂單
G06Q10-10 .辦公自動化,例如電子郵件或群件的計算機輔助管理
- 數據顯示系統、數據中繼設備、數據中繼方法、數據系統、接收設備和數據讀取方法
- 數據記錄方法、數據記錄裝置、數據記錄媒體、數據重播方法和數據重播裝置
- 數據發送方法、數據發送系統、數據發送裝置以及數據結構
- 數據顯示系統、數據中繼設備、數據中繼方法及數據系統
- 數據嵌入裝置、數據嵌入方法、數據提取裝置及數據提取方法
- 數據管理裝置、數據編輯裝置、數據閱覽裝置、數據管理方法、數據編輯方法以及數據閱覽方法
- 數據發送和數據接收設備、數據發送和數據接收方法
- 數據發送裝置、數據接收裝置、數據收發系統、數據發送方法、數據接收方法和數據收發方法
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置





