[發明專利]一種基于循環神經網絡的患病風險預測建模方法有效
| 申請號: | 201611247218.2 | 申請日: | 2016-12-29 |
| 公開(公告)號: | CN106778014B | 公開(公告)日: | 2020-06-16 |
| 發明(設計)人: | 吳健;林志文;顧盼;周立水;鄧水光;李瑩;尹建偉;吳朝暉 | 申請(專利權)人: | 浙江大學 |
| 主分類號: | G16H50/30 | 分類號: | G16H50/30;G16H50/70;G16H50/50 |
| 代理公司: | 杭州天勤知識產權代理有限公司 33224 | 代理人: | 胡紅娟 |
| 地址: | 310013 浙江*** | 國省代碼: | 浙江;33 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 循環 神經網絡 患病 風險 預測 建模 方法 | ||
本發明公開了一種基于循環神經網絡的患病風險預測方法,包括:(1)利用診斷的疾病作為訓練樣本,進行疾病名稱分布式詞向量訓練,得到詞向量映射矩陣,并進行存儲;(2)再次利用診斷的疾病作為訓練樣本,進行循環神經網絡訓練,得到患病風險預測模型;(3)將病人歷史記錄中每種診斷疾病作為一個測試樣本輸入患病風險預測模型,得到患病風險預測結果。該方法利用循環神經網絡與分布式詞向量表達嵌入技術,解決了因醫療診斷數據具有維度高、數據稀疏、時序性強等特點導致的訓練模型過于復雜、訓練成本高以及訓練準確率低等問題,實現了針對歷史患病信息進行具有時序性的建模過程。
技術領域
本發明屬于醫療數據挖掘領域,具體涉及一種基于循環神經網絡的患病風險預測建模方法。
背景技術
疾病風險預測是根據大量患者的歷史患病信息進行建模,并根據建立的模型進行疾病風險預測的綜合系統。疾病患病風險預測大致可以分為經驗預測和定量預測。
經驗預測作為一種主要依靠預測人員經驗和直觀判斷能力的預測方法,不需要或只需要少量的計算,較適用于缺乏歷史數據的場景。其主要方法包括:模糊聚類預測法、Delphi法、主觀概率法。經驗預測主要依托于人為經驗與主觀判讀,且人工成本高,無法實現大量高準確度的預測。
定量預測是依托于大量歷史數據,運用統計、機器學習等方法對疾病患病風險進行數學建模。隨著醫療信息化和計算機科學技術的飛速發展,醫療行業積累了大量豐富的醫療數據,越來越多的醫療診斷、健康檢查數據存儲在醫療機構數據中心。因此,越來越多的研究人員及企業在研究如何利用這些電子健康記錄進行疾病風險定量預測。
目前,針對疾病預測的某一特定領域,已經有許多專業人士通過機器學習等方法建立了預測某一種特定疾病的模型。在Dimitrios H.Mantzaris 等人發表的文獻“Medicaldisease prediction using artificial neural networks[C]//BioInformatics andBioEngineering”中,提出了使用人工神經網絡的思想對疾病進行預測。他們針對骨質疏松疾病,把其患病風險預測問題作為一種模式分類問題,使用多層感知器(MLPs)及概率神經網絡 (PNN)建立預測模型,實現了較為準確的疾病預測結果。由于醫療診斷數據目前存在兩大問題,使得難以建立合理的預測模型。
問題一:由于疾病種類繁多,導致將疾病診斷數據利用傳統單熱 (One-hot)式詞向量表示方式來表示的向量維度高且十分稀疏。在傳統單熱式詞向量表達方式中,首先,按順序將每個疾病進行編號,創建詞表庫;然后,按詞表庫的順序將疾病轉換為向量形式,該向量的維度為疾病的總類別數。向量的元素只有0或1,其中:0表示未患該位置對應詞表庫的疾病;1表示患得該位置對應詞表庫的疾病。例如,現在共有A、B、C 三種疾病,按ABC順序生成詞表庫,若一個人某次患A、C兩種疾病,則對應的疾病向量為[1,0,1]。如果,就診數據包含1萬中疾病,則對應的疾病向量將達到1萬維。這使得建立的模型過于復雜,增加模型訓練成本,且降低模型的預測準確率。
問題二:疾病發展過程具有很強的時序性,傳統的疾病預測模型,僅使用單次診斷及檢測數據作為模型輸入,未考慮將多次診斷及檢測作為輸入。因此,能否設計出一種兼顧上訴問題的合理預測模型,成為當前亟待解決的問題。
發明內容
解決了因醫療診斷數據具有維度高、數據稀疏的特點導致的訓練模型過于復雜、訓練成本高以及訓練準確率低等問題。鑒于上述,本發明提供了一種基于循環神經網絡的患病風險預測建模方法,主要是利用循環神經網絡與分布式詞向量表達嵌入技術,實現了利用醫療診斷數據等電子健康記錄進行疾病風險預測。
一種基于循環神經網絡的患病風險預測建模方法,包括以下步驟:
(1)利用診斷的疾病作為訓練樣本,進行疾病名稱分布式詞向量訓練,得到詞向量映射矩陣,并進行存儲;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于浙江大學,未經浙江大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201611247218.2/2.html,轉載請聲明來源鉆瓜專利網。





