[發(fā)明專利]基于多熱編碼的多特征融合深度知識追蹤方法及系統(tǒng)有效
| 申請?zhí)枺?/td> | 202011056680.0 | 申請日: | 2020-09-29 |
| 公開(公告)號: | CN112182308B | 公開(公告)日: | 2023-03-24 |
| 發(fā)明(設(shè)計(jì))人: | 劉三女牙;孫建文;張凱;李卿;栗大智;鄒睿 | 申請(專利權(quán))人: | 華中師范大學(xué) |
| 主分類號: | G06F16/901 | 分類號: | G06F16/901;G06F16/903;G06F17/16;G06F18/214;G06N3/0464 |
| 代理公司: | 武漢東喻專利代理事務(wù)所(普通合伙) 42224 | 代理人: | 雷霄 |
| 地址: | 430079 *** | 國省代碼: | 湖北;42 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 基于 編碼 特征 融合 深度 知識 追蹤 方法 系統(tǒng) | ||
本發(fā)明公開了一種基于多熱編碼的多特征融合深度知識追蹤方法及系統(tǒng)。該方法包括步驟:獲取學(xué)生的答題數(shù)據(jù)集;提取問題編號特征p、技能編號特征s、答題表現(xiàn)特征c、嘗試次數(shù)特征att、首次操作特征act、學(xué)生首次反應(yīng)時(shí)間特征frt;將提取的6個特征轉(zhuǎn)換為分類變量;將問題編號特征p和技能編號特征s進(jìn)行多熱編碼,獲得多熱技能編碼Multi(multi_s),將其他特征進(jìn)行獨(dú)熱編碼,獲得獨(dú)熱編碼O,將多熱技能編碼Multi(multi_s)和獨(dú)熱編碼O進(jìn)行拼接及降維處理后輸入到深度知識追蹤模型進(jìn)行知識追蹤。本發(fā)明可以提高數(shù)據(jù)集的數(shù)據(jù)利用率,并且實(shí)現(xiàn)多技能的預(yù)測。
技術(shù)領(lǐng)域
本發(fā)明屬于知識追蹤技術(shù)領(lǐng)域,更具體地,涉及基于多熱編碼的多特征融合深度知識追蹤方法及系統(tǒng)。
背景技術(shù)
知識追蹤(Knowledge Tracing)任務(wù)是利用計(jì)算機(jī)技術(shù),根據(jù)學(xué)生過去的答題記錄,對學(xué)生的知識掌握情況進(jìn)行建模,進(jìn)一步得到學(xué)生當(dāng)前知識狀態(tài)的表示,從而可以準(zhǔn)確預(yù)測學(xué)生在下一次答題時(shí)的表現(xiàn)。其中提到的學(xué)生過去的答題記錄,通常以時(shí)間序列的形式呈現(xiàn)出來。由于題目設(shè)置和考察能力的綜合性,每道問題往往不僅包含一個技能,這也是建立知識追蹤模型非常困難的原因。
目前主流知識追蹤模型將技能編號(skill id)和答題表現(xiàn)(correct)作為模型的輸入,將多個特征引入深度知識追蹤模型,對多特征均進(jìn)行獨(dú)熱編碼,拼接成新的特征向量作為模型的輸入,預(yù)測學(xué)生對下一個問題的回答正確率。
但是現(xiàn)有技術(shù)存在以下缺點(diǎn):(1)大多數(shù)研究者僅選用技能編號(skill id)和正確性(correct)兩個特征,數(shù)據(jù)利用率低;(2)將多技能問題拆分為多個單技能問題,沒有考慮一道題目同時(shí)考察多個技能的情況,無法預(yù)測多技能問題的表現(xiàn)。
發(fā)明內(nèi)容
針對現(xiàn)有技術(shù)的至少一個缺陷或改進(jìn)需求,本發(fā)明提供了一種基于多熱編碼的多特征融合深度知識追蹤方法及系統(tǒng),可以提高數(shù)據(jù)集的數(shù)據(jù)利用率,并且實(shí)現(xiàn)多技能的預(yù)測。
為實(shí)現(xiàn)上述目的,按照本發(fā)明的第一方面,提供了一種基于多熱編碼的多特征融合深度知識追蹤方法,包括步驟:
獲取學(xué)生的答題數(shù)據(jù)集,所述答題數(shù)據(jù)集包括多條答題記錄,每條所述答題記錄包括一個問題和一個學(xué)生在回答該問題時(shí)的交互信息,所述問題關(guān)聯(lián)多個技能;
從所述答題數(shù)據(jù)集中提取問題編號特征p、技能編號特征s、答題表現(xiàn)特征c、嘗試次數(shù)特征att、首次操作特征act和學(xué)生首次反應(yīng)時(shí)間特征frt;
將所述問題編號特征p、所述技能編號特征s、所述答題表現(xiàn)特征c、所述嘗試次數(shù)特征att、所述首次操作特征act和所述學(xué)生首次反應(yīng)時(shí)間特征frt轉(zhuǎn)換為分類變量;
將轉(zhuǎn)換為分類變量后的所述問題編號特征p和所述技能編號特征s進(jìn)行多熱編碼,獲得多熱技能編碼Multi(multi_s),將轉(zhuǎn)換為分類變量后的所述答題表現(xiàn)特征c、所述嘗試次數(shù)特征att、所述首次操作特征act、所述學(xué)生首次反應(yīng)時(shí)間特征frt進(jìn)行獨(dú)熱編碼,獲得獨(dú)熱編碼O,將所述多熱技能編碼Multi(multi_s)和所述獨(dú)熱編碼O進(jìn)行拼接,獲得輸入向量vt;
將所述輸入向量vt進(jìn)行降維處理后輸入到深度知識追蹤模型,所述深度知識追蹤模型用于輸出每個技能的預(yù)測值,根據(jù)所述深度知識追蹤模型的輸出確定對下一個問題的預(yù)測結(jié)果。
優(yōu)選的,所述進(jìn)行多熱編碼包括步驟:
遍歷所述答題數(shù)據(jù)集,引入一個嵌入矩陣Q,所述嵌入矩陣Q形式為:Q={Qij}M×K,其中M為問題總數(shù)目,K為技能總數(shù)目,在所述嵌入矩陣Q中,每一行對應(yīng)一個問題,每一列對應(yīng)一個技能,所述嵌入矩陣Q中的向量表達(dá)為Qes:
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于華中師范大學(xué),未經(jīng)華中師范大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011056680.0/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





