[發明專利]一種基于組稀疏融合醫院大數據建立學生成長畫像的方法在審
| 申請號: | 202010418640.X | 申請日: | 2020-05-18 |
| 公開(公告)號: | CN111652291A | 公開(公告)日: | 2020-09-11 |
| 發明(設計)人: | 潘志方;潘文標;孫未未 | 申請(專利權)人: | 溫州醫科大學 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62;G16H10/60 |
| 代理公司: | 溫州名創知識產權代理有限公司 33258 | 代理人: | 陳加利 |
| 地址: | 325000 浙江省溫州市甌海*** | 國省代碼: | 浙江;33 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 稀疏 融合 醫院 數據 建立 學生 成長 畫像 方法 | ||
1.一種基于組稀疏融合醫院大數據建立學生成長畫像的方法,其特征在于,所述方法包括以下步驟:
步驟S1:獲取學生的多源高維數據,包括學生基本信息數據、學校學習數據、日常生活數據和醫院規培實習數據;
步驟S2:對所獲取的多源高維數據進行數據預處理;
步驟S3:基于稀疏算法中的三元組表示法對預處理后的樣本數據集進行壓縮存儲;
步驟S4:利用二分K-means聚類算法將相關性強的特征標簽進行分組,并基于學生成長畫像模型中對應的數據中的數據屬性差異有所不同,通過反復迭代運算,構建出更貼合學生實際情況的學生成長畫像標簽體系;
步驟S5:在建立的學生成長畫像標簽體系基礎上,將各個標簽組合成不同的特征標簽組后,基于局部學習獲取樣本數據特征標簽組的聚類分布信息;
步驟S6:在聚類分布信息的指導下,借助組稀疏回歸獲取特征權重,用于評估特征的重要性,挑選出相應的重要特征標簽,根據高維數據所建立學生成長畫像標簽體系,構建出立體的學生成長畫像。
2.如權利要求1所述的基于組稀疏融合醫院大數據建立學生成長畫像的方法,其特征在于,所述學生基本信息數據為來自于包括姓名、性別、年齡、籍貫及其他相關的個人基礎數據;所述學校學習數據為來自于包括課程信息、考試成績、競賽成績、選修課及圖書館借閱信息的相關學習數據;所述日常生活數據為來自于包括在校期間所能采集到的住宿信息、一卡通數據、食堂消費數據、洗衣房數據及其他衣食住行方面的相關日常生活數據;所述醫院規培實習數據為來自于包括醫院見習成績、實習評價、科研成果相關醫院培養數據。
3.如權利要求1所述的基于組稀疏融合醫院大數據建立學生成長畫像的方法,其特征在于,所述數據預處理包括數據清洗、數據集成、數據變換、數據規范化、數據規約等工作。
4.如權利要求1所述的基于組稀疏融合醫院大數據建立學生成長畫像的方法,其特征在于,根據二分K-means聚類算法將相關性強的特征標簽進行分組后,可以將高維數據中的數據標簽體系進行劃分,構建出學生畫像模型中多種標簽體系,并基于各生活模型對應于高維數據中的數據屬性差異,進一步構建出所述學生畫像模型的標簽體系,所述學生畫像模型的標簽體系包括事實標簽、模型標簽和預測標簽。
5.如權利要求1所述的基于組稀疏融合醫院大數據建立學生成長畫像的方法,其特征在于,所述事實標簽根據統計分析生成,其來源于真實數據,定性描述學生的基本屬性;所述模型標簽通過建模分析生成,是對學生屬性及行為進行抽象和聚類概括出來的;所述預測標簽通過模型預測得到的,是根據學生信息和行為配合一定的規則策略設定。
6.如權利要求1所述的基于組稀疏融合醫院大數據建立學生成長畫像的方法,其特征在于,在這基礎上基于組稀疏模型(Group Lasso)對樣本數據集進行特征選擇,并對每個樣本進行特征標簽組進行信息標注,為每一個學生建立一個自己個性化的立體成長畫像,在學習過程中,成長畫像能指引學生進行針對性地查漏補缺,指導學校及時調整教學培養計劃,在構建畫像中,需要根據不同畫像標簽的特點和需求選擇建模算法,以此優化學生成長畫像,更加精準地描摹出的學生成長畫像的特征標簽。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于溫州醫科大學,未經溫州醫科大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010418640.X/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種分布式GIS實時協同驅動方法
- 下一篇:防孤島保護裝置及系統





