[發明專利]基于大數據的學習預警方法在審
| 申請號: | 201910361563.6 | 申請日: | 2019-04-30 |
| 公開(公告)號: | CN110189236A | 公開(公告)日: | 2019-08-30 |
| 發明(設計)人: | 胡挺;宋汀;夏冰;任盈盈 | 申請(專利權)人: | 南京航空航天大學 |
| 主分類號: | G06Q50/20 | 分類號: | G06Q50/20;G06Q10/04;G06K9/62 |
| 代理公司: | 江蘇圣典律師事務所 32237 | 代理人: | 賀翔 |
| 地址: | 210016 江*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 預警 大數據 支持向量機分類器 多元線性回歸 近鄰算法 聚類分析 課程成績 思想動態 學生成績 學生學習 預測模型 質量提升 課程 預測 聚類 粗糙 集合 成績 采集 學習 挖掘 干預 學科 教學 學生 | ||
1.基于大數據的學習預警方法,其特征在于,所述預警方法包括以下步驟:
步驟一,以學校或某一學院為對象,采集該對象中全部學生全部學科的現有的績點成績;
步驟二,通過聚類分析得到初步的相關性課程,之后通過近鄰算法結合核支持向量機分類器在聚類得到的粗糙集合中挖掘課程間更深層次的聯系;
步驟三,基于多元線性回歸方法得出各必修課預測模型,根據現有學期的相關課程成績,在學期初預測各門重要必修課的成績。
2.根據權利要求1所述的基于大數據的學習預警方法,其特征在于,所述步驟二中,首先,通過高斯核的譜聚類算法將課程進行聚類,將全部課程間的關系采用點與點之間的距離來描述:
通過計算所有點之間的歐氏距離wij=||xi-xj||2來構造一個距離矩陣W,之后通過高斯核函數來構造相似矩陣S,其中sij=kij,接下來,譜聚類算法在構造度矩陣D,在非對角線上的元素設為0,再構造拉普拉斯矩陣L=D-W,將拉普拉斯矩陣標準化后對它求前k個最小的特征值對應的特征向量,構造出一個n
d的矩陣,再對該矩陣進行k均值聚類得到簇劃分結果C={C1,C2,...,Ck};xi是第i個樣本,特征列向量,kij是高斯核函數,sij是矩陣里的數列;
其次,定義如下的高斯混合分布模型為概率密度函數:
該分布共由k個混合成分構成,每個混合成分對應一個高斯分布,其中μi與是第i個高斯混合成分的參數,而αi>0為相應的混合系數,PM(x)是高斯混合分布;
通過已有的學生成績樣本點的采樣,估計出該學生的學習能力所對應的概率密度函數;
再進一步用所述概率密度函數對未開課課程進行預測。
3.根據權利要求2所述的基于大數據的學習預警方法,其特征在于,對所述高斯核函數的求解過程具體為:
根據高斯核函數把距離矩陣轉換為相似矩陣,這樣距離近的點相似度大,距離遠的點相似度小,之后建立拉普拉斯矩陣L=D-W,用求出拉普拉斯矩陣的前k個最小特征值對應的k個特征向量,在歸一化得到n×k的矩陣,再對它進行kmeans聚類得到最終的聚類結果。
4.根據權利要求3所述的基于大數據的學習預警方法,其特征在于,步驟三中,將先上的學期課程設定為已結課的課程,而后上的學期的課程設定為未結課的課程;采用分類方法,將成績按照得分成若干類;
以已結課的課程為訓練數據,已結課的課程為特征,某一門未結課的課程為標簽,將成績預測轉換成類別預測,建立分類問題,采用XGBoost算法,相關課程的評判采用判定特征重要度的高低,特征重要度定義為以該特征在某一類成績中分裂的次數的總和。
5.根據權利要求4所述的基于大數據的學習預警方法,其特征在于,所述步驟三中,根據softmax函數計算出后續課程預測成績屬于類別i的概率,
設輸出的類別為a1,a2,a3,a4,a5,a6……an,對每個學生成績樣本,它屬于類別i的概率為
對softmax函數進行求導,代入softmax函數表達式,可以得到:
當i=j時,
當i≠j時:
其中aj對應學生成績樣本;
得出預測出的后續課程成績在每一個類別的概率分布,為已結課課程對后續課程相關性的統計學概率分布。
6.根據權利要求2所述的基于大數據的學習預警方法,其特征在于,成績按照得分成若干類。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于南京航空航天大學,未經南京航空航天大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910361563.6/1.html,轉載請聲明來源鉆瓜專利網。





