[發明專利]醫療數據預處理方法、裝置和電子設備在審
| 申請號: | 201910034052.3 | 申請日: | 2019-01-15 |
| 公開(公告)號: | CN111435613A | 公開(公告)日: | 2020-07-21 |
| 發明(設計)人: | 郭曉方;金敏;劉穎豐;徐長水;雷錦誌 | 申請(專利權)人: | 金敏 |
| 主分類號: | G16H50/30 | 分類號: | G16H50/30;G16H10/60 |
| 代理公司: | 北京彩和律師事務所 11688 | 代理人: | 張紅春 |
| 地址: | 100840 北京市*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 醫療 數據 預處理 方法 裝置 電子設備 | ||
1.一種醫療數據預處理方法,其特征在于,包括:
對獲取的與客戶相關的原始醫療數據進行數據清理處理,以獲得經過數據清理之后的已清理醫療數據;
對所述已清理醫療數據進行歸一化處理,以獲得經過歸一化處理之后的已歸一化醫療數據;以及
對所述已歸一化醫療數據進行異常值處理,以獲得經過異常值處理之后的訓練醫療數據,其中,所述訓練醫療數據用于錄入至模型訓練表中,且所述模型訓練表構成訓練集,用于對癌癥預測模型進行訓練。
2.根據權利要求1所述的醫療數據預處理方法,其中,所述與客戶相關的原始醫療數據包括:客戶姓名、性別、出生日期、年齡、身份證號、護照、港澳回鄉證、臺胞證、醫院體檢號或病案號、身高、體重、收縮壓、舒張壓、體檢時間、紅細胞、紅細胞比積、中性粒細胞%、中性粒細胞數、單核細胞%、單核細胞數、嗜堿性粒細胞%、嗜堿性粒細胞數、嗜酸性粒細胞%、嗜酸性粒細胞數、平均血紅蛋白量、平均血紅蛋白量濃度、血小板平均體積、白細胞、紅細胞平均體積、血小板、血小板體積分布寬度、淋巴細胞%、淋巴細胞數、RBC分別寬度-cv、RBC分別寬度-sd、血小板比積、血紅蛋白、白蛋白、谷丙轉氨酶、谷草轉氨酶、γ-谷氨酰轉肽酶、肌酐、尿素、尿酸、空腹血糖、總膽固醇、甘油三脂、高密度脂蛋白、低密度脂蛋白、載脂蛋白a、載脂蛋白b、總膽紅素、超敏C反應蛋白、乳酸脫氫酶、總膽汁酸、膽堿酯酶、堿性磷酸酶、α-L-巖藻糖苷酶、β2-微球蛋白(β2-MG)、總蛋白、潛血、尿膽素、尿糖、酮體、尿蛋白、尿膽原、亞硝酸鹽、白細胞、維生素、比重、酸堿值、甲胎蛋白、糖類抗原125(CA125)、糖類抗原15-3(CA15-3)、糖類抗原19-9(CA19-9)、糖類抗原72-4(CA72-4)、癌胚抗原(CEA)、細胞角蛋白19(CYFRA21-1)、鐵蛋白(FER)、神經元特異烯醇化酶(NSE)、前列腺特異性抗原(PSA)、血粘度、還原粘度、相對粘度、血漿粘度、紅細胞沉降率ESR、血沉方程k值、人工干預情況、醫院電話號碼、科室來源、創建時間和疾病名稱。
3.根據權利要求1或2所述的醫療數據預處理方法,其中,對獲取的與客戶相關的原始醫療數據進行數據清理處理,以獲得經過數據清理之后的已清理醫療數據,包括如下步驟至少之一:
填補所述原始醫療數據中的缺失項的值;
識別并消除所述原始醫療數據中的離群點;以及
糾正所述原始醫療數據中的不一致的數據項。
4.根據權利要求3所述的醫療數據預處理方法,其中,填補所述原始醫療數據中的缺失項的數值,包括:
基于由所述模型訓練表所構成的訓練集中的同一性別的對應數據項的數值分布特征,填補所述缺失項的缺失值。
5.根據權利要求4所述的醫療數據預處理方法,其中,對所述已清理醫療數據進行歸一化處理,以獲得經過歸一化處理之后的已歸一化醫療數據,包括:
基于由所述模型訓練表所構成的訓練集中每一數據項中的最大值和最小值,逐一對所述已清理醫療數據中的數據項進行歸一化處理,其中該歸一化過程用公式可表示為:(XOld-minX)/(maxX-minX),其中,XOld表示所述已清理醫療數據的數據項,minX表示基于由所述模型訓練表所構成的訓練集中對應數據項中的最小值,以及,maxX表示由所述模型訓練表所構成的訓練集中對應數據項中的最大值。
6.根據權利要求5所述的醫療數據預處理方法,其中,對所述已歸一化醫療數據進行異常值處理,以獲得經過異常值處理之后的訓練醫療數據,包括:
響應于所述已歸一化醫療數據中數據項的值滿足屬于0-1區間內,設定對應數據項為正常數據項;以及
響應于所述已歸一化醫療數據中所有數據項為正常數據項,將所述已歸一化醫療數據設定為所述訓練醫療數據。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于金敏,未經金敏許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910034052.3/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:智能安全主控
- 下一篇:一種結球甘藍輕簡化的套種方法
- 數據顯示系統、數據中繼設備、數據中繼方法、數據系統、接收設備和數據讀取方法
- 數據記錄方法、數據記錄裝置、數據記錄媒體、數據重播方法和數據重播裝置
- 數據發送方法、數據發送系統、數據發送裝置以及數據結構
- 數據顯示系統、數據中繼設備、數據中繼方法及數據系統
- 數據嵌入裝置、數據嵌入方法、數據提取裝置及數據提取方法
- 數據管理裝置、數據編輯裝置、數據閱覽裝置、數據管理方法、數據編輯方法以及數據閱覽方法
- 數據發送和數據接收設備、數據發送和數據接收方法
- 數據發送裝置、數據接收裝置、數據收發系統、數據發送方法、數據接收方法和數據收發方法
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置





