[發明專利]一種大數據醫療數據特征提取和智能分析預測方法在審
| 申請號: | 201811570429.9 | 申請日: | 2018-12-21 |
| 公開(公告)號: | CN109686441A | 公開(公告)日: | 2019-04-26 |
| 發明(設計)人: | 王衎清;張倬勝 | 申請(專利權)人: | 質直(上海)教育科技有限公司 |
| 主分類號: | G16H50/20 | 分類號: | G16H50/20;G16H50/70 |
| 代理公司: | 武漢科皓知識產權代理事務所(特殊普通合伙) 42222 | 代理人: | 魯力 |
| 地址: | 200120 上海市徐*** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 醫療數據 大數據 自然語言處理技術 特征提取 智能分析 預測 神經網絡模型 結構化處理 關鍵信息 數據清洗 特征挖掘 文本轉化 醫療信息 自由文本 挖掘 向量化 治愈率 萃取 病歷 診療 驗證 幫助 保存 記錄 醫生 分析 學習 | ||
由于醫療信息和病人的病史以自由文本格式保存在病歷里,自然語言處理技術可以幫助醫生從龐大的記錄中萃取出關鍵信息,并將文本轉化為可使用的知識,用深度學習、自然語言處理技術及大數據技術,幫助醫療數據進行結構化處理和挖掘。本發明公開了一種大數據醫療數據特征提取和智能分析預測方法,具體包括如下步驟:數據清洗,數據向量化,病例挖掘與特征挖掘,深度神經網絡模型訓練,病情診療和治愈率預測,分析和驗證模型。
技術領域
本發明屬于計算機科學與醫療衛生的交叉領域,涉及一種針對醫療數據的特征提取與分析、病情診斷與治愈率預測方法。
背景技術
機器學習在生物制藥、醫療診斷等諸多領域大放異彩,改變了傳統的研究方法,提高了科研效率,促使眾多行業發生變革。通過學習數據中隱藏的深層信息,挖掘內在關聯,從而做出預測和判斷,使得機器學習系統具備極其有效的洞察在醫療大數據時代,基于深度學習技術,醫學專業教材、臨床指南和經典病例等資料,讓機器系統協助醫生診斷疾病、預測治愈率、提出診療建議,將助力醫院和醫學科研機構創新和人工智能輔助診療的廣泛應用,提升診斷準確度,幫助患者早發現、早治療。護理人員介入與應用該系統,逐步形成系統化、成熟化的“智慧醫院整體解決方案”,大幅削減醫療成本,同時提升醫院的工作效率、質量以及患者滿意度。
將數據分析、深度學習、數據挖掘等技術應用于真實世界的醫療數據,解決關鍵的醫療問題,例如疾病風險預測、相似患者分群、疾病發展及軌跡分析、治療依從性及有效性分析等。建立基于機器學習的先進的算法模型,輔助臨床醫生提升診療效率、減少誤診,從而有助于解決醫療資源嚴重不均衡的社會現象。
由于醫療信息和病人的病史以自由文本格式保存在病歷里,自然語言處理技術可以幫助醫生從龐大的記錄中萃取出關鍵信息,并將文本轉化為可使用的知識,用深度學習、自然語言處理技術及大數據技術,幫助醫療數據進行結構化處理和挖掘。本發明結合已有的病歷數據、基于深度學習挖掘病理特征和病因,實現自動的數據特征提取和智能分析預測。
發明內容
一種大數據醫療數據特征提取和智能分析預測方法,具體包括如下步驟:數據清洗,數據向量化,病例挖掘與特征挖掘,病情診療和治愈率預測,參數調優與更新。
本發明的提出一種大數據醫療數據特征提取和智能分析預測方法,能夠通過數據挖掘與分析醫療數據中的特征,實現自動化的病情診療和治愈率預測。
本發明所提出的一種大數據醫療數據特征提取和智能分析預測方法具體包括如下步驟:
一種大數據醫療病情診斷和治愈率預測方法,其特征在于,包括:
步驟1,采集病歷數據,并針對數據進行清洗,具體是進行電子化、格式化、歸一化病歷數據,去除無效、無關的數據,作為系統輸入;
步驟2,將輸入病歷數據進行向量化,具體是將中文病歷進行分詞,作為系統輸入的基本單元。
步驟3,挖掘步驟2輸出的病歷數據,并進行信息提取,具體是將病歷數據都表示成向量之后,通過神經網絡提取其中的內在特征和病理,
步驟4,獲取病情診斷和治愈率預測結果。
步驟5,參數調優與更新,機器學習模塊通過訓練使預測值擬合于真實治愈率,計算預測值和真實值之間的誤差(損失函數),更新系統參數,不斷降低損失,使結果不斷趨向準確。
在上述的一種大數據醫療病情診斷和治愈率預測方法,步驟1的具體方法包括:對于不同量綱的數值統一量綱單位;使用歸一化方法統一數值型數據的分布區間,方法為:
歸一化后的數值=(原數值-最小值)/(最大值-最小值)
在上述的一種大數據醫療病情診斷和治愈率預測方法,步驟2中進行向量化的具體步驟是:
步驟一,建立詞語表,具體是遍歷全部數據,得到全部的詞語集合。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于質直(上海)教育科技有限公司,未經質直(上海)教育科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811570429.9/2.html,轉載請聲明來源鉆瓜專利網。





