[發明專利]老年健康數據知識分析方法和系統在審
| 申請號: | 201910854775.8 | 申請日: | 2019-09-10 |
| 公開(公告)號: | CN110729052A | 公開(公告)日: | 2020-01-24 |
| 發明(設計)人: | 顧東曉;李童童;李興國;王曉玉;江政;陸文星;鐘金宏;趙樹平;楊雪潔;蘇凱翔;葉紫薇;苗夏雨 | 申請(專利權)人: | 合肥工業大學 |
| 主分類號: | G16H50/70 | 分類號: | G16H50/70;G16H10/20 |
| 代理公司: | 11542 北京久誠知識產權代理事務所(特殊普通合伙) | 代理人: | 余罡 |
| 地址: | 230009 安*** | 國省代碼: | 安徽;34 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 老年健康 調查數據 評價指標 知識發現 自變量 數據處理技術 老年人健康 基于機器 集成學習 解釋機器 數據知識 特征選擇 維度分析 影響因素 解釋性 學習性 因變量 構建 分析 引入 融入 學習 | ||
本發明提供一種老年健康數據知識分析方法和系統,涉及數據處理技術領域。本發明提出了基于集成學習的特征選擇方法,構建知識發現模型,同時融入基于機器學習評價指標和解釋機器學習性評價方法,使得老年健康調查數據知識發現模型既有評價指標又引入了解釋性評價方法,能從多個維度分析老年健康調查數據中的自變量與因變量的關系,從而能準確、全面的分析出老年人健康影響因素。
技術領域
本發明涉及數據處理技術領域,具體涉及一種老年健康數據知識 分析方法和系統。
背景技術
老年健康數據包括日常活動能力、器具性活動能力、教育程度、 工作類型、運動習慣、飲食健康、醫療服務、心理狀態等方面的個人 數據。老年健康數據具有復雜性、精確性、安全性、異構性及封閉性 的特點。對老年人健康影響因素的全面分析研究,對于科學認識老齡 化健康問題和實現健康的老齡化具有重要意義。
長期以來,健康普查數據的分析方法一直是統計方法或者簡單的 線性回歸分析,即通過提出假設再進行挖掘驗證數據中的關系。
然而,現有的基于統計方法或者簡單的線性回歸分析的健康普查 數據的分析方法雖然可以較為充分的利用有限的寶貴數據,但提出的 假設一般是基于某個主要因素,例如居住模式、教育水平、經濟地位 等進行相應的考察,沒有結合多個方面的具體因素進行綜合考慮,存 在一定的局限性,導致分析結果準確度不高。
發明內容
(一)解決的技術問題
針對現有技術的不足,本發明提供了一種老年健康數據知識分析 方法和系統,解決了分析結果準確度不高的技術問題。
(二)技術方案
為實現以上目的,本發明通過以下技術方案予以實現:
本發明提供一種老年健康數據知識分析方法,所述方法由計算機 執行,包括以下步驟:
S1、獲取老年健康調查數據;
S2、對所述老年健康調查數據進行預處理;
S3、對預處理之后的老年健康調查數據進行集成特征選擇,得到 關鍵特征;
S4、基于所述關鍵特征獲取知識發現模型;
S5、基于機器學習評價指標、解釋機器學習性評價方法和所述知 識發現模型,獲取老年健康調查數據知識發現模型;
S6、基于所述老年健康調查數據知識發現模型分析所述老年健康 調查數據,得到所述老年健康調查數據中的自變量與因變量的關系。
優選的,所述預處理包括缺失值處理。
優選的,所述缺失值處理包括:
S201、記一組老年健康調查數據為x1......xk,以統一的形式表示 這組老年健康調查數據中的缺失值;
S202、從第一個老年健康調查數據開始,如果x1有缺失值,將在 其他變量x2到xk上回歸,將x1中的缺失值替換為預測值,所述預測值由 來自x1的后驗預測分布模擬得出;
S203、對于下一個具有缺失值的老年健康調查數據xi,在所有其他 老年健康調查數據x1......xk上回歸,xi中的缺失值被來自xi的后驗預測分 布的模擬值所取代,將老年健康調查數據中的所有缺失值進行替換。
優選的,所述集成特征選擇包括:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于合肥工業大學,未經合肥工業大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910854775.8/2.html,轉載請聲明來源鉆瓜專利網。





