[發明專利]一種基于圖表示學習的慢病風險預測方法在審
| 申請號: | 202210539116.7 | 申請日: | 2022-05-10 |
| 公開(公告)號: | CN114898879A | 公開(公告)日: | 2022-08-12 |
| 發明(設計)人: | 邱航;楊萍;王利亞 | 申請(專利權)人: | 電子科技大學 |
| 主分類號: | G16H50/30 | 分類號: | G16H50/30;G16H50/20 |
| 代理公司: | 成都先導云創知識產權代理事務所(普通合伙) 51321 | 代理人: | 李坤 |
| 地址: | 611731 四川省成*** | 國省代碼: | 四川;51 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 圖表 學習 風險 預測 方法 | ||
1.一種基于圖表示學習的慢病風險預測方法,其特征在于,包括以下步驟:
步驟1:基于病案首頁數據提取患者的住院記錄數據,并將其儲存在數據庫中;
步驟2:基于數據庫中的住院記錄數據建立由節點和有向邊構成的個人疾病網絡;所述節點用于表示疾病,邊的方向表示疾病出現的先后順序,權值表示在患者個體的住院序列中,該有向邊關聯的有向疾病對出現的頻率;
步驟3:在步驟1中提取的住院記錄數據中提取訓練樣本,并基于訓練樣本定義詞嵌入模型,使用噪音對比估計損失函數訓練所述詞嵌入模型,并基于訓練好的詞嵌入模型得到每個疾病的初始向量;
步驟4:基于個人疾病網絡構建慢病風險預測模型;所述慢病風險預測模型由圖卷積層和圖池化層堆疊構成;
所述圖卷積層為多關系注意力卷積,用于分別聚合不同疾病演進方向下的節點的領域信息,以更新節點的嵌入表示;同一演進方向下的不同的鄰居節點對中心節點的注意力權值不同;
圖池化層為集成邊權重的邊收縮池化,用于逐步抽取圖更高層的信息,實現對個人疾病網絡的層次化學習。
2.根據權利要求1所述的一種基于圖表示學習的慢病風險預測方法,其特征在于,在所述步驟1中基于住院記錄數據按照時間順序聚合同一個患者的多次住院記錄,并針對每個患者,選取一次住院記錄作為觀察窗口和預測窗口的分界線;所選取的住院記錄的住院時間及其之前的住院數據定義為觀察窗口,所選取的住院記錄的住院時間之后的住院數據定義為預測窗口;觀察窗口內的住院數據用于構建所述個人疾病網絡;并在所述觀察窗口內選取至少有兩次住院記錄的住院數據作為所述訓練樣本;所述預測窗口內的住院記錄數據用于定義慢病標簽。
3.根據權利要求1所述的一種基于圖表示學習的慢病風險預測方法,其特征在于,所述步驟2中定義目標患者的節點所形成的節點集V={d1,d2,...,dm},di∈V為目標患者曾診斷出的疾病,所有的i,j∈[1,m],且di≠dj;E為有向邊組成的集合;邊的方向反映疾病發病的時間順序,邊的權重定義為有向疾病對出現的頻率;具體的,有向邊di→dj的權重Weightdi→dj定義為:
式中:ri∈Ri,rj∈Rj;Ri、Rj分別表示診斷有疾病di和dj的住院序號按照住院時間排序組成的集合;n表示目標患者的住院次數。
4.根據權利要求1所述的一種基于圖表示學習的慢病風險預測方法,其特征在于,所述詞嵌入模型的訓練步驟如下:
定義所述數據庫中包含有N條住院記錄,并將所有出現過的疾病組合成集合D,疾病di∈D;首先對疾病進行獨熱編碼,疾病dk的獨熱編碼c定義為:c∈{0,1}|D|,c[k]=1;對所有的j∈[0,|D|]且j≠k,c[j]=0;
將每條住院記錄中的主要診斷的獨熱編碼作為詞嵌入模型的輸入,次要診斷為預測標簽,提取訓練樣本,訓練詞嵌入模型。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于電子科技大學,未經電子科技大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202210539116.7/1.html,轉載請聲明來源鉆瓜專利網。





