[發明專利]一種基于循環神經網絡的患病風險預測建模方法有效
| 申請號: | 201611247218.2 | 申請日: | 2016-12-29 |
| 公開(公告)號: | CN106778014B | 公開(公告)日: | 2020-06-16 |
| 發明(設計)人: | 吳健;林志文;顧盼;周立水;鄧水光;李瑩;尹建偉;吳朝暉 | 申請(專利權)人: | 浙江大學 |
| 主分類號: | G16H50/30 | 分類號: | G16H50/30;G16H50/70;G16H50/50 |
| 代理公司: | 杭州天勤知識產權代理有限公司 33224 | 代理人: | 胡紅娟 |
| 地址: | 310013 浙江*** | 國省代碼: | 浙江;33 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 循環 神經網絡 患病 風險 預測 建模 方法 | ||
1.一種基于循環神經網絡的患病風險預測建模方法,包括以下步驟:
(1)利用診斷的疾病作為訓練樣本,進行疾病名稱分布式詞向量訓練,得到詞向量映射矩陣,并進行存儲,具體包括以下步驟:
(1-1)對疾病診斷數據進行預處理:將每名患者的m種疾病按照診斷的順序排序,選取前n種疾病組成第一個疾病序列,選取第2種疾病~第n+1種疾病組成第二個疾病序列,選取第3種疾病~第n+2種疾病組成第三個疾病序列,以此類推,得到m-n+1個疾病序列,n的取值為5、7或9,m為自然數;
(1-2)將每個疾病序列中處于中間位置的疾病作為詞向量訓練模型的真實輸出,剩余的疾病組成的序列作為詞向量訓練模型訓練樣本,將訓練樣本中的每種疾病按照診斷的順序依次輸入到詞向量訓練模型,進行疾病名稱分布式詞向量訓練,得到每個疾病所對應的分布式詞向量,從而組成詞向量映射矩陣,并進行存儲;
(2)再次利用診斷的疾病作為訓練樣本,進行循環神經網絡訓練,得到患病風險預測模型。
2.根據權利要求1所述的基于循環神經網絡的患病風險預測建模方法,其特征在于:在步驟(1-2)中,采用連續詞袋模型作為詞向量訓練模型。
3.根據權利要求1所述的基于循環神經網絡的患病風險預測建模方法,其特征在于:步驟(2)的具體步驟為:
(2-1)將每名患者所有次就診行為所確診的疾病作為就診序列,刪除就診行為次數小于5的就診序列,且刪除就診序列中相鄰兩次就診行為后一次中重復確診的疾病,得到預處理后的就診序列作為循環神經網絡訓練樣本;
(2-2)將循環神經網絡訓練樣本輸入到循環神經網絡模型中,利用詞向量映射矩陣將訓練樣本轉化為疾病向量;
(2-3)將確診的歷史疾病轉化為向量,并作為循環神經網絡模型的真實輸出,利用疾病向量對循環神經網絡進行訓練,得到患病風險預測模型。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于浙江大學,未經浙江大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201611247218.2/1.html,轉載請聲明來源鉆瓜專利網。





