[發(fā)明專利]一種學(xué)生數(shù)據(jù)挖掘系統(tǒng)及方法在審
| 申請?zhí)枺?/td> | 202010611073.X | 申請日: | 2020-06-30 |
| 公開(公告)號: | CN111752995A | 公開(公告)日: | 2020-10-09 |
| 發(fā)明(設(shè)計)人: | 岳希;唐孟軒 | 申請(專利權(quán))人: | 成都信息工程大學(xué) |
| 主分類號: | G06F16/2458 | 分類號: | G06F16/2458;G06F16/248 |
| 代理公司: | 成都云縱知識產(chǎn)權(quán)代理事務(wù)所(普通合伙) 51316 | 代理人: | 熊曦 |
| 地址: | 610225 四川省成都*** | 國省代碼: | 四川;51 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 學(xué)生 數(shù)據(jù) 挖掘 系統(tǒng) 方法 | ||
1.一種學(xué)生數(shù)據(jù)挖掘系統(tǒng),其特征在于,所述系統(tǒng)包括:
數(shù)據(jù)采集模塊,用于采集學(xué)生成績數(shù)據(jù)并存儲至數(shù)據(jù)庫;
樣本選擇模塊,用于從數(shù)據(jù)庫中選擇學(xué)生成績樣本,學(xué)生成績樣本根據(jù)分類標(biāo)簽分為合格學(xué)生成績樣本和不合格學(xué)生成績樣本;
屬性統(tǒng)計模塊,用于統(tǒng)計學(xué)生成績樣本的分類屬性的屬性值;
樣本預(yù)處理模塊,用于對學(xué)生成績樣本進行初步分類和數(shù)據(jù)預(yù)處理,處理后獲得訓(xùn)練樣本即分類數(shù)據(jù)集;
模型建立及訓(xùn)練模塊,用于構(gòu)建數(shù)據(jù)挖掘模型,并基于訓(xùn)練樣本對數(shù)據(jù)挖掘模型進行訓(xùn)練,獲得訓(xùn)練后的數(shù)據(jù)挖掘模型,其中,數(shù)據(jù)挖掘模型在進行對數(shù)計算時采用預(yù)設(shè)對數(shù)計算公式進行計算,預(yù)設(shè)對數(shù)計算公式為:
其中,x為需要進行對數(shù)運算的值;
輸出模塊,用于將待挖掘?qū)W生數(shù)據(jù)輸入訓(xùn)練后的數(shù)據(jù)挖掘模型,模型輸出學(xué)生數(shù)據(jù)挖掘結(jié)果。
2.根據(jù)權(quán)利要求1所述的學(xué)生數(shù)據(jù)挖掘系統(tǒng),其特征在于,所述系統(tǒng)還包括數(shù)據(jù)導(dǎo)出模塊,用于將數(shù)據(jù)挖掘模型挖掘處理后的結(jié)果導(dǎo)出至數(shù)據(jù)庫中,用于后續(xù)分析。
3.根據(jù)權(quán)利要求1所述的學(xué)生數(shù)據(jù)挖掘系統(tǒng),其特征在于,數(shù)據(jù)挖掘模型基于條件屬性間的相關(guān)性選擇樣本分裂屬性。
4.根據(jù)權(quán)利要求1所述的學(xué)生數(shù)據(jù)挖掘系統(tǒng),其特征在于,數(shù)據(jù)挖掘模型采用余弦相似度計算樣本屬性相似度。
5.根據(jù)權(quán)利要求1所述的學(xué)生數(shù)據(jù)挖掘系統(tǒng),其特征在于,數(shù)據(jù)挖掘模型的數(shù)據(jù)挖掘過程包括:
步驟a:計算待分類數(shù)據(jù)集的信息熵;
步驟b:計算待分類數(shù)據(jù)集屬性的信息熵;
步驟c:計算待分類數(shù)據(jù)集屬性的信息增益;
步驟d:計算待分類數(shù)據(jù)集屬性信息增益率;
步驟e:比較每個屬性的屬性值中是否有信息熵在閾值范圍內(nèi)的屬性值對,若有則執(zhí)行步驟f,若沒有則執(zhí)行步驟j;
步驟f:計算兩個屬性值對的余弦相似值,若余弦相似值大于閾值則執(zhí)行步驟g,否則執(zhí)行步驟j;
步驟g:針對數(shù)值型屬性將兩個屬性值向量合并成新的屬性值向量,將屬性中參與比較的屬性值刪除,添加新的屬性值,構(gòu)成新的屬性;針對非數(shù)值型數(shù)據(jù),將兩者中分類屬性較多的刪除;
步驟h:根據(jù)修改后的屬性重新計算屬性的信息熵和信息增益率;
步驟j:從屬性集中選擇出信息增益最大的屬性作為分裂節(jié)點循環(huán)迭代,當(dāng)訓(xùn)練集屬性全部遍歷或者分類結(jié)果不再變化時,停止迭代,得到?jīng)Q策樹。
6.根據(jù)權(quán)利要求5所述的學(xué)生數(shù)據(jù)挖掘系統(tǒng),其特征在于,根據(jù)公式8比較每個屬性的屬性值中是否有信息熵在閾值范圍內(nèi)的屬性值對,公式8為:
ΔInfo(v1,v2)=|Info(S)v1-Info(S)v2|ε (8)
其中,ΔInfo(v1,v2)為信息熵差;Info(S)v1為v1的信息熵;Info(S)v2為v1的信息熵;ε為設(shè)定值;v1、v2為屬性值。
7.根據(jù)權(quán)利要求5所述的學(xué)生數(shù)據(jù)挖掘系統(tǒng),其特征在于,根據(jù)公式6計算兩個屬性值對的余弦相似值,公式6為:
其中,cosθ為兩個向量之間的余弦相似度;θ為向量與之間的夾角。
8.根據(jù)權(quán)利要求5所述的學(xué)生數(shù)據(jù)挖掘系統(tǒng),其特征在于,針對數(shù)值型屬性根據(jù)公式13將兩個屬性值向量合并成新的屬性值向量,公式13為:
其中,為合并后新的屬性值向量。
9.根據(jù)權(quán)利要求1所述的學(xué)生數(shù)據(jù)挖掘系統(tǒng),其特征在于,采用分類變量方法將獲取的學(xué)生成績樣本數(shù)據(jù)分為有序變量和無序變量兩類;無序變量中,利用二項分類法將普通考察科目是否通過分為是和否,利用多項分類法將不同專業(yè)分為軟件、控制和通信;利用有序變量法將考試考察科目成績分為優(yōu)秀、良好和及格三類;
數(shù)據(jù)預(yù)處理包括:缺失數(shù)據(jù)處理、錯誤值檢測、異常數(shù)據(jù)檢測和清理、光滑噪聲、不一致數(shù)據(jù)清理和連續(xù)數(shù)據(jù)離散化。
10.一種學(xué)生數(shù)據(jù)挖掘方法,其特征在于,所述方法包括:
采集學(xué)生成績數(shù)據(jù)并存儲至數(shù)據(jù)庫;
從數(shù)據(jù)庫中選擇學(xué)生成績樣本,學(xué)生成績樣本根據(jù)分類標(biāo)簽分為合格學(xué)生成績樣本和不合格學(xué)生成績樣本;
統(tǒng)計學(xué)生成績樣本的分類屬性的屬性值;
對學(xué)生成績樣本進行初步分類和數(shù)據(jù)預(yù)處理,處理后獲得訓(xùn)練樣本;
構(gòu)建數(shù)據(jù)挖掘模型,并基于訓(xùn)練樣本對數(shù)據(jù)挖掘模型進行訓(xùn)練,獲得訓(xùn)練后的數(shù)據(jù)挖掘模型,其中,數(shù)據(jù)挖掘模型在進行對數(shù)計算時采用預(yù)設(shè)對數(shù)計算公式進行計算,預(yù)設(shè)對數(shù)計算公式為:
其中,x為需要進行對數(shù)運算的值;
將待挖掘?qū)W生數(shù)據(jù)輸入訓(xùn)練后的數(shù)據(jù)挖掘模型,模型輸出學(xué)生數(shù)據(jù)挖掘結(jié)果。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于成都信息工程大學(xué),未經(jīng)成都信息工程大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010611073.X/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 一種學(xué)生卡系統(tǒng)
- 人工智能交互式學(xué)習(xí)系統(tǒng)及教育方法
- 一種基于學(xué)生信息的教學(xué)監(jiān)控方法
- 獲取學(xué)生特征的方法、裝置、設(shè)備及計算機可讀存儲介質(zhì)
- 檢測學(xué)生專注度的方法、計算機存儲介質(zhì)及計算機設(shè)備
- 一種體感定位學(xué)生鞋
- 一種考勤統(tǒng)計方法、系統(tǒng)及終端設(shè)備
- 基于大數(shù)據(jù)的學(xué)生行為預(yù)警分析方法及系統(tǒng)
- 一種學(xué)習(xí)環(huán)境下的歸位提醒方法及電子設(shè)備
- 基于課堂場景的學(xué)生行為識別方法及系統(tǒng)
- 數(shù)據(jù)顯示系統(tǒng)、數(shù)據(jù)中繼設(shè)備、數(shù)據(jù)中繼方法、數(shù)據(jù)系統(tǒng)、接收設(shè)備和數(shù)據(jù)讀取方法
- 數(shù)據(jù)記錄方法、數(shù)據(jù)記錄裝置、數(shù)據(jù)記錄媒體、數(shù)據(jù)重播方法和數(shù)據(jù)重播裝置
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)發(fā)送系統(tǒng)、數(shù)據(jù)發(fā)送裝置以及數(shù)據(jù)結(jié)構(gòu)
- 數(shù)據(jù)顯示系統(tǒng)、數(shù)據(jù)中繼設(shè)備、數(shù)據(jù)中繼方法及數(shù)據(jù)系統(tǒng)
- 數(shù)據(jù)嵌入裝置、數(shù)據(jù)嵌入方法、數(shù)據(jù)提取裝置及數(shù)據(jù)提取方法
- 數(shù)據(jù)管理裝置、數(shù)據(jù)編輯裝置、數(shù)據(jù)閱覽裝置、數(shù)據(jù)管理方法、數(shù)據(jù)編輯方法以及數(shù)據(jù)閱覽方法
- 數(shù)據(jù)發(fā)送和數(shù)據(jù)接收設(shè)備、數(shù)據(jù)發(fā)送和數(shù)據(jù)接收方法
- 數(shù)據(jù)發(fā)送裝置、數(shù)據(jù)接收裝置、數(shù)據(jù)收發(fā)系統(tǒng)、數(shù)據(jù)發(fā)送方法、數(shù)據(jù)接收方法和數(shù)據(jù)收發(fā)方法
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)再現(xiàn)方法、數(shù)據(jù)發(fā)送裝置及數(shù)據(jù)再現(xiàn)裝置
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)再現(xiàn)方法、數(shù)據(jù)發(fā)送裝置及數(shù)據(jù)再現(xiàn)裝置





