[發明專利]基于MOOC日志數據中用戶行為因果關系的學習效果優化方法有效
| 申請號: | 202010415168.4 | 申請日: | 2020-05-15 |
| 公開(公告)號: | CN111723973B | 公開(公告)日: | 2022-12-09 |
| 發明(設計)人: | 魏筆凡;郭敏;劉均;鄭慶華;郝子琛;卜德蕊;鄧婷 | 申請(專利權)人: | 西安交通大學 |
| 主分類號: | G06Q10/04 | 分類號: | G06Q10/04;G06Q50/20;G06N5/04;G06N20/00 |
| 代理公司: | 西安通大專利代理有限責任公司 61200 | 代理人: | 姚詠華 |
| 地址: | 710049 *** | 國省代碼: | 陜西;61 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 mooc 日志 數據 用戶 行為 因果關系 學習 效果 優化 方法 | ||
1.基于MOOC日志數據中用戶行為因果關系的學習效果優化方法,其特征在于,包括以下步驟:
步驟100,對MOOC用戶學習日志數據去除異常值、補充缺失值并對連續數據進行離散化處理,得到處理后的數據集;
步驟200,從步驟100得到的數據集中篩選協變量,通過probit回歸模型對篩選出的協變量進行傾向性匹配計算,通過檢驗所述協變量是否滿足模型的平衡性,若滿足則選取為因果自變量;
步驟300,基于步驟200所選取的因果自變量,依次在不同數據規模下通過貝葉斯網絡生成算法得到網絡群組,觀測對于不同網絡規模數據集獲得因果網絡的平均馬爾可夫毯長度趨勢,獲取代表數據集整體特性最小數據集對應的規模,采用啟發式搜索算法,增加每次保存的路徑數,生成因果網絡群組;
步驟400,針對步驟300所得到的因果網絡群組,采用專家精確度評分算法篩選網絡節點間的邊,得到經過篩選的網絡群組,通過集成學習使用Bagging投票機制綜合生成最終因果網絡;
步驟500,根據步驟400所得因果網絡中節點的含義找出代表用戶學習效果的結果變量節點;通過因果網絡中邊的指向,得出多個結果變量節點的父節點及祖先節點,將所述父節點及祖先節點作為原因變量節點,根據原因變量節點和結果變量節點對用戶學習路徑做出規劃,改變用戶的操作行為或者用戶的學習時間來提高用戶完成課程學習的概率。
2.根據權利要求1所述的基于MOOC日志數據中用戶行為因果關系的學習效果優化方法,其特征在于,步驟100具體包括以下步驟:
步驟101,對MOOC用戶學習日志數據的用戶操作行為、用戶操作時間和所選課程屬性分類,剔除異常值;
步驟102,通過對MOOC用戶學習日志數據中匹配用戶名和課程編號的匹配,得到用戶行為以及課程數據;
步驟103,對MOOC用戶學習日志數據的缺失值使用均值進行填充,對連續型數據進行離散化處理。
3.根據權利要求1所述的基于MOOC日志數據中用戶行為因果關系的學習效果優化方法,其特征在于,步驟200中,在經過步驟100處理后的MOOC用戶學習日志數據集中依次選取任意變量作為控制變量,其余變量作為用戶傾向性匹配的協變量;對協變量進行歸一化處理;
步驟2011,基于步驟100得到的離散化MOOC用戶學習日志數據集,先選中一個特征變量作為probit回歸模型中的一個協變量,將其他變量作為待選協變量;
步驟2012,在probit回歸模型的基礎上分別估計待選協變量的極大似然值,選擇其中最大的對數極大似然值對應的協變量,放入probit回歸模型;
步驟2013,設定閾值,篩選出步驟2012中所得極大似然估計值對應的協變量作為選取好的協變量。
4.根據權利要求1所述的基于MOOC日志數據中用戶行為因果關系的學習效果優化方法,其特征在于,步驟200中,對篩選出的協變量進行用戶傾向性匹配,并通過匹配完成的數據來驗證傾向性匹配模型是否滿足平衡性的假設,將滿足假設的變量加入因果自變量集,具體如下:
步驟2021,選取所述協變量中的一個變量作為控制變量,其余協變量作為用戶傾向性匹配的協變量幾何,采用probit回歸模型計算得出用戶的傾向性評分,設定匹配規則得到試驗組和對照組;
步驟2022,使用最鄰近匹配法來對試驗組和對照組進行1:1匹配,根據步驟2021所得到的每組不同的傾向性評分,找到得分差異最小的一組樣本;
步驟2023,采用反事實推斷模型,驗證其步驟2022得到的匹配結果,得到當前控制變量對因變量的影響程度進而將其粗略當作其原因因子,將其選入因果自變量集中。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于西安交通大學,未經西安交通大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010415168.4/1.html,轉載請聲明來源鉆瓜專利網。
- 同類專利
- 專利分類
G06Q 專門適用于行政、商業、金融、管理、監督或預測目的的數據處理系統或方法;其他類目不包含的專門適用于行政、商業、金融、管理、監督或預測目的的處理系統或方法
G06Q10-00 行政;管理
G06Q10-02 .預定,例如用于門票、服務或事件的
G06Q10-04 .預測或優化,例如線性規劃、“旅行商問題”或“下料問題”
G06Q10-06 .資源、工作流、人員或項目管理,例如組織、規劃、調度或分配時間、人員或機器資源;企業規劃;組織模型
G06Q10-08 .物流,例如倉儲、裝貨、配送或運輸;存貨或庫存管理,例如訂貨、采購或平衡訂單
G06Q10-10 .辦公自動化,例如電子郵件或群件的計算機輔助管理
- 數據顯示系統、數據中繼設備、數據中繼方法、數據系統、接收設備和數據讀取方法
- 數據記錄方法、數據記錄裝置、數據記錄媒體、數據重播方法和數據重播裝置
- 數據發送方法、數據發送系統、數據發送裝置以及數據結構
- 數據顯示系統、數據中繼設備、數據中繼方法及數據系統
- 數據嵌入裝置、數據嵌入方法、數據提取裝置及數據提取方法
- 數據管理裝置、數據編輯裝置、數據閱覽裝置、數據管理方法、數據編輯方法以及數據閱覽方法
- 數據發送和數據接收設備、數據發送和數據接收方法
- 數據發送裝置、數據接收裝置、數據收發系統、數據發送方法、數據接收方法和數據收發方法
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置





