[發明專利]一種基于數據驅動的知識點掌握狀態的預測系統及方法在審
| 申請號: | 201611046483.4 | 申請日: | 2016-11-23 |
| 公開(公告)號: | CN106779166A | 公開(公告)日: | 2017-05-31 |
| 發明(設計)人: | 余勝泉;盧宇;陳陽 | 申請(專利權)人: | 北京師范大學 |
| 主分類號: | G06Q10/04 | 分類號: | G06Q10/04;G06Q50/20 |
| 代理公司: | 北京科迪生專利代理有限責任公司11251 | 代理人: | 楊學明,顧煒 |
| 地址: | 100875 北*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 數據 驅動 知識點 掌握 狀態 預測 系統 方法 | ||
技術領域
本發明涉及一種基于數據驅動的知識點掌握狀態的預測系統及方法,屬于數據挖掘技術,特別是涉及教育領域的數據挖掘。
背景技術
數據挖據是一種基于大量數據進行信息提取和知識發現的方法,已經被廣泛應用于互聯網、工業制造、交通等各個領域。數據挖掘在教育領域的應用相對比較新穎,主要涉及概率統計、機器學習與自然語言等學科,主要的方法包括聚類、關聯規則學習、相關性分析、回歸性分析以及分類等,常用的模型包括貝葉斯模型、決策樹、隱形馬爾可夫模型等。貝葉斯預測模型是運用貝葉斯統計進行的一種預測,需要掌握先驗信息和總體分布信息進行建模和預測。決策樹模型可以看作是對象屬性和對象值之間的一種映射,樹中的節點表示對象屬性的判斷條件,其分支是符合節點條件的對象,其葉子節點表示對象所屬的預測結果。隱形馬爾可夫模型基于隱含未知參數的馬爾可夫過程,需要從可觀察的參數中確定該過程的隱含參數,然后利用這些參數來作進一步的分析。在教育領域,數據挖據的應用目前主要用來支持教育決策、對學生進行信息和課程內容的推薦等。
發明內容
本發明要解決的問題是:克服現有技術的不足,提供一種基于數據驅動的知識點掌握狀態的預測系統及方法,對學習者知識點掌握狀態進行預測和估計,從而為學習者提供個性化的教學服務,提高學習針對性和學習效率。
本發明解決其問題所采用的方案是:一種基于數據驅動的知識點掌握狀態的預測系統,包括測試題目的生成和屬性標注模塊、訓練數據采集模塊、基于測試數據的多維度特征提取模塊、數據驅動的預測模型建立模塊,其中:
測試題目的生成和屬性標注模塊:根據課程標準按照所屬學科及知識點之間的父子關系進行整理,對每個學科形成N層知識點結構;同時,根據學習者進行相應學科的認知活動能力和心理調節能力,將學科能力進行分級;根據所述的N層知識點結構和學科能力分級,生成所需測試題目;對于所述生成的所有測試題目,進行水平等級劃分,將測試題目劃分為多個等級;對于需測試題目的每個第N層知識點,也就是每個最底層知識點,生成的測試題目數量需滿足最少題目要求;
訓練數據采集模塊:基于測試題目的生成和屬性標注模塊生成的測試題目,組織學習者進行測試,測試可以采用線上系統電子化測試或者線下試卷測試;學習者應涵蓋同一年齡各層次水平的人群;測試過程應在獨立且無干擾的條件下進行;訓練數據可以分多次、不同時段進行收集,但是不可以在同一學習者上進行反復測試;同時,如果單一學習者的訓練數據不完整或者有明顯抄襲、重復答案等特征,應該從訓練數據集中移除,最終得到有效的訓練數據;
基于訓練數據的多維度特征提取模塊:對訓練數據采集模塊得到的每位學習者的數據,首先進行基本特征的逐級特征提取,對測試所涉及的每個第N層知識點,分別計算得分率,所有得分率作為第N層知識點基本特征向量VN;對于每個第N-1層知識點,如果其下轄的所有第N層知識點均有得分率,則稱為已知知識點,計算已知知識點所下轄的所有知識點的平均得分率作為該N-1層知識點的基本特征值;如果該N-1層知識點下轄知識點的得分率部分缺失或者全部缺失,則該第N-1層知識點稱為未知知識點;未知知識點的基本特征值為空;對所有第N-1層已知知識點,得到其基本特征向量VN-1;同理,能夠得到各層已知知識點的基本特征向量VN-2,VN-3,…,V1;同時,將學習者的性別、年齡個人特征作為補充特征向量G,從而完成訓練數據的多維度特征提取,多維度特征包括各層已知知識點的基本特征向量VN-2,VN-3,…,V1和補充特征向量G;
數據驅動的預測模型建立模塊:標注訓練數據中已知知識點掌握程度YA,標注根據各項得分率結合經驗規則進行,標注的知識點掌握程度可以分為多個等級;對于標注的已知知識點掌握程度YA,根據各層已知知識點的基本特征向量VN-2,VN-3,…,V1及補充特征向量G,建立多元分類算法的單一預測模型,預測出知識點A的掌握程度YA。所述單一預測模型是指基于單個預測模型,包括人工神經網絡、隨機森林或邏輯回歸的經典模型。先對各個預測模型進行準確度評估,根據評估結果,最終決定其中一種模型作為預測模型。
所述標注已知知識點掌握程度YA的多個等級包括卓越、優秀、良好、合格以及不合格。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京師范大學,未經北京師范大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201611046483.4/2.html,轉載請聲明來源鉆瓜專利網。
- 同類專利
- 專利分類
G06Q 專門適用于行政、商業、金融、管理、監督或預測目的的數據處理系統或方法;其他類目不包含的專門適用于行政、商業、金融、管理、監督或預測目的的處理系統或方法
G06Q10-00 行政;管理
G06Q10-02 .預定,例如用于門票、服務或事件的
G06Q10-04 .預測或優化,例如線性規劃、“旅行商問題”或“下料問題”
G06Q10-06 .資源、工作流、人員或項目管理,例如組織、規劃、調度或分配時間、人員或機器資源;企業規劃;組織模型
G06Q10-08 .物流,例如倉儲、裝貨、配送或運輸;存貨或庫存管理,例如訂貨、采購或平衡訂單
G06Q10-10 .辦公自動化,例如電子郵件或群件的計算機輔助管理
- 數據顯示系統、數據中繼設備、數據中繼方法、數據系統、接收設備和數據讀取方法
- 數據記錄方法、數據記錄裝置、數據記錄媒體、數據重播方法和數據重播裝置
- 數據發送方法、數據發送系統、數據發送裝置以及數據結構
- 數據顯示系統、數據中繼設備、數據中繼方法及數據系統
- 數據嵌入裝置、數據嵌入方法、數據提取裝置及數據提取方法
- 數據管理裝置、數據編輯裝置、數據閱覽裝置、數據管理方法、數據編輯方法以及數據閱覽方法
- 數據發送和數據接收設備、數據發送和數據接收方法
- 數據發送裝置、數據接收裝置、數據收發系統、數據發送方法、數據接收方法和數據收發方法
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置





