[發明專利]心腦血管患者相似性分析方法及系統在審
| 申請號: | 201710057343.5 | 申請日: | 2017-01-26 |
| 公開(公告)號: | CN106778042A | 公開(公告)日: | 2017-05-31 |
| 發明(設計)人: | 童曉渝;章玉宇;崔修濤;王永明;熊偉;胡天龍;廖光源 | 申請(專利權)人: | 中電科軟件信息服務有限公司 |
| 主分類號: | G06F19/00 | 分類號: | G06F19/00;G06K9/62 |
| 代理公司: | 上海漢聲知識產權代理有限公司31236 | 代理人: | 郭國中 |
| 地址: | 200233 上海市嘉定區*** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 腦血管 患者 相似性 分析 方法 系統 | ||
1.一種心腦血管患者相似性分析方法,其特征在于,其包括以下步驟:
步驟一,問題定義,基于歷史數據對心腦血管患者進行細化分群,研究特定治療手段對特定人群治療結局的影響,并針對個體患者推薦個性化治療方案,將幫助臨床醫生更精準地認識目標患者的病情以及治療手段所帶來的預后效果,從而有效地實現個性化精準醫療;
步驟二,數據采集,針對目標人群,從相關信息系統收集觀察期窗口內的患者醫療健康數據及預后結局數據,所采集的數據包括:康復科門診數據、康復科治療室數據、神內/神外門診數據、神內/神外住院數據、康復科住院數據、腦卒中篩查門診數據,這些數據涉及的內容涵蓋有患者基本信息、病歷或電子病歷、檢測檢驗、影像、診斷、處方、治療、評估表數據;
步驟三,數據預處理,所采集的數據類型多種多樣,包括:選擇項、日期時間、數值型、字符型以及是否型數據,針對不同數據類型需要采取不同處理方法進行針對性數據預處理;
步驟四,特征工程,患者數據來自多個臨床數據庫,涉及患者個體生理信息、歷史診療信息、病情信息,在使用機器學習技術建模學習數據之前,首先需要使用特定領域知識以及統計學習方法來提取或組合變化得到的各屬性數據,從而生成有效的特征數據;
步驟五,基于相似性的患者聚類建模,采用基于劃分的聚類算法,即k-均值算法進行患者的聚類建模,其中通過夾角余弦來度量患者之間的相似性;
步驟六,診療方案推薦,當患者問診時,結合問診患者的個體特征和病患群體特征,采用基于相似性計算的群組定向技術,為問診患者找到最相近歷史病患群組,抽取出該群組內病患的主體診療方案作為首選診療方案推薦給問診患者。
2.根據權利要求1所述的心腦血管患者相似性分析方法,其特征在于,所述步驟三具體包括以下步驟:
步驟三十一,數據集成,把不同來源的數據按照一定規則整合到一起,根據病人ID號把不同數據源但是有同樣ID號的信息連接在一起,這樣所有不同數據源的數據就整合到了一起;
步驟三十二,數據清洗,針對不同數據類型存在的不同問題,提出了基于規則的數據清洗方法;
步驟三十三,缺失值處理,醫療領域的特征數據普遍在時間序列上比較稀疏,因此采用基于正則化最大期望算法進行缺失數據的填補,將缺失特征變量視為無法觀測的隱藏變量,此方法一般分為三步:一,計算最大期望;二,正則化EM,避免過度擬合;三,對上一步生成的方程進行評估;
步驟三十四,特征刪除,根據專家知識對那些無效值和缺失值超過總樣本量30%的,對于診斷問題不是特別重要的特征進行刪除處理;
步驟三十五,去異常點,采用偏差分析、基于分布不合理性的異常檢測方法,結合常識性規則、業務特定規則進行異常值的識別,并對異常點進行刪除處理。
3.根據權利要求1所述的心腦血管患者相似性分析方法,其特征在于,所述步驟四具體包括以下步驟:
步驟四十一,特征構造和特征選擇,其基于預處理后的數據,通過特征構造和特征選擇技術識別潛在的風險因子;
步驟四十二,特征處理,使用log映射函數將特征取值映射到[0,1]區間,同時采用等值劃分方法對連續數據的離散化處理,將特征空間按照值域進行均分,每一段內的取值等同處理。
4.一種心腦血管患者相似性分析系統,其特征在于,其包括:
問題定義模塊,基于歷史數據對心腦血管患者進行細化分群,研究特定治療手段對特定人群治療結局的影響,并針對個體患者推薦個性化治療方案;
數據采集模塊,從相關信息系統收集觀察期窗口內的患者醫療健康數據及預后結局數據;
數據預處理模塊,針對不同數據類型需要采取不同處理方法進行針對性數據預處理;
特征工程生成模塊,生成有效的特征數據;
患者聚類建模模塊,采用基于劃分的聚類算法,即k-均值算法進行患者的聚類建模;
診療方案推薦模塊,采用基于相似性計算的群組定向技術,為問診患者找到最相近歷史病患群組,抽取出該群組內病患的主體診療方案作為首選診療方案推薦給問診患者;
數據庫,存儲數據采集模塊采集的數據以及診療方案推薦模塊的治療方案。
5.根據權利要求4所述的心腦血管患者相似性分析系統,其特征在于,所述問題定義模塊、數據采集模塊、數據預處理模塊、特征工程生成模塊、患者聚類建模模塊、診療方案推薦模塊依次連接,數據庫與數據采集模塊連接。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中電科軟件信息服務有限公司,未經中電科軟件信息服務有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710057343.5/1.html,轉載請聲明來源鉆瓜專利網。
- 同類專利
- 專利分類
G06F 電數字數據處理
G06F19-00 專門適用于特定應用的數字計算或數據處理的設備或方法
G06F19-10 .生物信息學,即計算分子生物學中的遺傳或蛋白質相關的數據處理方法或系統
G06F19-12 ..用于系統生物學的建模或仿真,例如:概率模型或動態模型,遺傳基因管理網絡,蛋白質交互作用網絡或新陳代謝作用網絡
G06F19-14 ..用于發展或進化的,例如:進化的保存區域決定或進化樹結構
G06F19-16 ..用于分子結構的,例如:結構排序,結構或功能關系,蛋白質折疊,結構域拓撲,用結構數據的藥靶,涉及二維或三維結構的
G06F19-18 ..用于功能性基因組學或蛋白質組學的,例如:基因型–表型關聯,不均衡連接,種群遺傳學,結合位置鑒定,變異發生,基因型或染色體組的注釋,蛋白質相互作用或蛋白質核酸的相互作用





