[發明專利]一種集成的無監督學生行為聚類方法在審
| 申請號: | 202011461457.4 | 申請日: | 2020-12-07 |
| 公開(公告)號: | CN112488236A | 公開(公告)日: | 2021-03-12 |
| 發明(設計)人: | 李小勇;張勇;程會敏;尹寶才 | 申請(專利權)人: | 北京工業大學 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62;G06Q50/20 |
| 代理公司: | 北京思海天達知識產權代理有限公司 11203 | 代理人: | 張慧 |
| 地址: | 100124 *** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 集成 監督 學生 行為 方法 | ||
1.一種集成的無監督學生行為聚類方法,其特征在于包括以下步驟:
(1)采集學生的行為數據;
(2)對學生的行為數據進行預處理;
(3)對預處理后的學生行為數據進行特征提取及選擇;
(4)對經過選擇后的學生行為特征空間進行無監督聚類,具體如下:
首先利用DBSCAN算法對經過選擇后的學生行為特征進行初始聚類;
然后,利用K-means算法對每種行為的DBSCAN初始聚類結果中的超大類進行細分,完成最終的聚類,其中,將包含80%以上樣本的類視為超大類;
(5)聚類結果的可視化。
2.根據權利要求1所述的一種集成的無監督學生行為聚類方法,其特征在于:
步驟(1)所述的學生行為數據包括消費行為數據、進入圖書館的行為數據、登錄網關系統的行為數據,具體如下:
消費行為數據,包括時間、地點、消費金額三個屬性;根據消費時間和消費地點,進一步將消費行為數據分為早餐行為數據、午餐行為數據、晚餐行為數據以及購物行為數據,其中,三餐行為的消費時間段分別規定為6:00am至9:00am,11:00am至2:00pm,以及4:30pm至8:30pm,而購物行為的時間段定義為全天;
進入圖書館的行為數據,僅包含進入時間一個屬性;
登錄網關系統的行為數據,網關系統是部署在因特網和校園局域網之間的協議轉換器,當學生需要通過校園網訪問因特網時,必須登錄網關;網關系統記錄學生的登錄時間、注銷時間、登錄地點、訪問時長以及使用的網絡流量。
3.根據權利要求2所述的一種集成的無監督學生行為聚類方法,其特征在于:
步驟(2)所述學生行為數據的預處理具體包括:
第一步:對學號進行匿名處理;
第二步:按照預設的時間間隔將一天24小時均勻劃分為多個時間刻度,將每個時間間隔內行為記錄的時間轉化為該時間間隔對應的時間刻度;
第三步:對時間變換后的行為記錄進行去重或合并操作:對于消費行為數據,將具有相同時間刻度和地點的消費記錄合并為一條記錄,消費金額等于被合并的消費金額之和;對于進入圖書館的行為數據,刪除重復記錄;對于登錄網關的行為數據,將具有相同登錄時間刻度和登錄地點的記錄合并為一條記錄,訪問時長和網絡流量進行求和處理,并保留最晚的注銷時間。
4.根據權利要求3所述的一種集成的無監督學生行為聚類方法,其特征在于:
步驟(3)所述的學生行為數據的特征提取具體如下:
消費行為特征提取:分別對早餐行為、午餐行為、晚餐行為和購物行為提取特征;特征包括:消費頻次、消費時間刻度的平均值、消費時間刻度的范圍、消費時間刻度的眾數、消費時間刻度的最小值、消費時間刻度的第一分位數、消費時間刻度的中位數、消費時間刻度的第三分位數、消費時間刻度的最大值、消費時間刻度的香農熵、消費地點的香農熵、消費金額平均值、消費金額范圍、消費金額眾數、消費金額最小值、消費金額第一分位數、消費金額中位數、消費金額第三分位數、消費金額最大值、消費金額方差;
進入圖書館行為的特征提取,特征包括:進入圖書館的頻次、進入時間刻度的平均值、進入時間刻度的范圍、進入時間刻度的眾數、進入時間刻度的最小值、進入時間刻度的第一分位數、進入時間刻度的中位數、進入時間刻度的第三分位數、進入時間刻度的最大值、進入時間刻度的香農熵;
登錄網關系統行為的特征提取,特征包括:登錄網關頻次、登錄時間刻度的平均值、登錄時間刻度的范圍、登錄時間刻度的眾數、登錄時間刻度的最小值、登錄時間刻度的第一分位數、登錄時間刻度的中位數、登錄時間刻度的第三分位數、登錄時間刻度的最大值、登錄時間刻度的香農熵、注銷時間刻度的平均值、注銷時間刻度的范圍、注銷時間刻度的眾數、注銷時間刻度的最小值、注銷時間刻度的第一分位數、注銷時間刻度的中位數、注銷時間刻度的第三分位數、注銷時間刻度的最大值、注銷時間刻度的香農熵、訪問時長平均值、訪問時長范圍、訪問時長眾數、訪問時長最小值、訪問時長第一分位數、訪問時長中位數、訪問時長第三分位數、訪問時長最大值、訪問時長方差、網絡流量平均值、網絡流量范圍、網絡流量眾數、網絡流量最小值、網絡流量第一分位數、網絡流量中位數、網絡流量第三分位數、網絡流量最大值、網絡流量方差、登錄網關的地點的香農熵。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京工業大學,未經北京工業大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011461457.4/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:霧化結構及霧化器
- 下一篇:一種舒適型高速電梯系統





