[發明專利]心腦血管患者相似性分析方法及系統在審
| 申請號: | 201710057343.5 | 申請日: | 2017-01-26 |
| 公開(公告)號: | CN106778042A | 公開(公告)日: | 2017-05-31 |
| 發明(設計)人: | 童曉渝;章玉宇;崔修濤;王永明;熊偉;胡天龍;廖光源 | 申請(專利權)人: | 中電科軟件信息服務有限公司 |
| 主分類號: | G06F19/00 | 分類號: | G06F19/00;G06K9/62 |
| 代理公司: | 上海漢聲知識產權代理有限公司31236 | 代理人: | 郭國中 |
| 地址: | 200233 上海市嘉定區*** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 腦血管 患者 相似性 分析 方法 系統 | ||
技術領域
本發明涉及一種智慧醫療領域,具體地,涉及一種心腦血管患者相似性分析方法及系統。
背景技術
隨著社會的發展,心腦血管疾病的發病率逐年上升。在我國,心腦血管疾病已成為當今嚴重危害中老年人生命與健康的主要公共衛生問題,其發病率、病死率、致殘率較高。根據統計,中國每年發生腦中風病人達200萬,致殘率高達75%,約3/4的患者有不同程度勞動喪失,生活需要照顧,給患者、家庭、社會帶來沉重的負擔。
隨著康復醫學在我國得到迅速發展,心腦血管患者的病死率顯著降低,但致殘率仍非常高。今后臨床治療模式將越來越呈現個性化、精確化,精準康復將是今后康復醫學發展方向。目前的康復治療沒有從臨床的角度根據病因、生理體征、生活習慣、生活環境等影響因子對患者群體進行基于相似性的有效分組,因此也就無法對患者進行個性化的康復治療,大大影響了患者的康復效果和滿意度。
隨著醫療信息化的發展,醫院也積累了大量的數據。如何更好的利用數據以及醫學知識,通過認知計算技術,提供精準醫療的決策是心腦血管疾病臨床治療階段所需要的。本發明的主要目標就是基于歷史數據將腦卒中康復患者細化分群,為特定患者找到患情最相似的一群其他患者,從而基于相似患者的診療實踐提取和挖據診療證據,為目標個體患者的個性化的康復治療項目。
到目前為止,基于認知計算技術的中國人群心腦血管疾病相似性分析方面尚屬空白。而國內外認知計算技術在心腦血管疾病中的應用主要集中在發病風險預測及診斷方面,在心腦血管患者相似性分析方面還尚未見有報道。鑒于國內外沒有可用于心腦血管患者相似性分析的智能模型,很有必要建立一種面向臨床醫生的心腦血管患者相似性分析模型。
發明內容
針對現有技術中的缺陷,本發明的目的是提供一種心腦血管患者相似性分析方法及系統,其建立有效地心腦血管患者相似性分析模型,臨床醫生通過患者特征就能得到給定患者的相似人群,然后推薦個性化治療方案,以達到精準醫療的目的,能夠很好的對中國人群心腦血管疾病患者進行基于相似性分析的人群分組,盡早針對不同的風險人群進行有針對性的個性化康復治療,具有巨大的醫療和臨床使用價值。
根據本發明的一個方面,提供一種心腦血管患者相似性分析方法,其特征在于,其包括以下步驟:
步驟一,問題定義,基于歷史數據對心腦血管患者進行細化分群,研究特定治療手段對特定人群治療結局的影響,并針對個體患者推薦個性化治療方案,將幫助臨床醫生更精準地認識目標患者的病情以及治療手段所帶來的預后效果,從而有效地實現個性化精準醫療;
步驟二,數據采集,針對目標人群,從相關信息系統收集觀察期窗口內的患者醫療健康數據及預后結局數據,所采集的數據包括:康復科門診數據、康復科治療室數據、神內/神外門診數據、神內/神外住院數據、康復科住院數據、腦卒中篩查門診數據,這些數據涉及的內容涵蓋有患者基本信息、病歷或電子病歷、檢測檢驗、影像、診斷、處方、治療、評估表數據;
步驟三,數據預處理,所采集的數據類型多種多樣,包括:選擇項、日期時間、數值型、字符型以及是否型數據,針對不同數據類型需要采取不同處理方法進行針對性數據預處理;
步驟四,特征工程,患者數據來自多個臨床數據庫,涉及患者個體生理信息、歷史診療信息、病情信息,在使用機器學習技術建模學習數據之前,首先需要使用特定領域知識以及統計學習方法來提取或組合變化得到的各屬性數據,從而生成有效的特征數據;
步驟五,基于相似性的患者聚類建模,采用基于劃分的聚類算法、k-均值算法進行患者的聚類建模,其中通過夾角余弦來度量患者之間的相似性;
步驟六,診療方案推薦,當患者問診時,結合問診患者的個體特征和病患群體特征,采用基于相似性計算的群組定向技術,為問診患者找到最相近歷史病患群組,抽取出該群組內病患的主體診療方案作為首選診療方案推薦給問診患者。
優選地,所述步驟三具體包括以下步驟:
步驟三十一,數據集成,把不同來源的數據按照一定規則整合到一起,根據病人ID號把不同數據源但是有同樣ID號的信息連接在一起,這樣所有不同數據源的數據就整合到了一起;
步驟三十二,數據清洗,針對不同數據類型存在的不同問題,提出了基于規則的數據清洗方法;
步驟三十三,缺失值處理,醫療領域的特征數據普遍在時間序列上比較稀疏,因此采用基于正則化最大期望算法進行缺失數據的填補,將缺失特征變量視為無法觀測的隱藏變量,此方法一般分為三步:一,計算最大期望;二,正則化EM,避免過度擬合;三,對上一步生成的方程進行評估;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中電科軟件信息服務有限公司,未經中電科軟件信息服務有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710057343.5/2.html,轉載請聲明來源鉆瓜專利網。
- 同類專利
- 專利分類
G06F 電數字數據處理
G06F19-00 專門適用于特定應用的數字計算或數據處理的設備或方法
G06F19-10 .生物信息學,即計算分子生物學中的遺傳或蛋白質相關的數據處理方法或系統
G06F19-12 ..用于系統生物學的建模或仿真,例如:概率模型或動態模型,遺傳基因管理網絡,蛋白質交互作用網絡或新陳代謝作用網絡
G06F19-14 ..用于發展或進化的,例如:進化的保存區域決定或進化樹結構
G06F19-16 ..用于分子結構的,例如:結構排序,結構或功能關系,蛋白質折疊,結構域拓撲,用結構數據的藥靶,涉及二維或三維結構的
G06F19-18 ..用于功能性基因組學或蛋白質組學的,例如:基因型–表型關聯,不均衡連接,種群遺傳學,結合位置鑒定,變異發生,基因型或染色體組的注釋,蛋白質相互作用或蛋白質核酸的相互作用





