[發(fā)明專利]一種使用預測模型預測疾病與藥物關聯(lián)關系的方法、裝置在審
| 申請?zhí)枺?/td> | 202211050896.5 | 申請日: | 2022-08-30 |
| 公開(公告)號: | CN115527649A | 公開(公告)日: | 2022-12-27 |
| 發(fā)明(設計)人: | 李龍飛;張振中 | 申請(專利權)人: | 京東方科技集團股份有限公司 |
| 主分類號: | G16H20/10 | 分類號: | G16H20/10 |
| 代理公司: | 北京金信知識產權代理有限公司 11225 | 代理人: | 崔家源 |
| 地址: | 100015 *** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 使用 預測 模型 疾病 藥物 關聯(lián) 關系 方法 裝置 | ||
1.一種使用預測模型預測疾病與藥物關聯(lián)關系的方法,其特征在于,
所述預測模型包括:第一自編碼器、第二自編碼器、第一多層感知機、第二多層感知機、第一解碼器;
所述方法包括:
將待測藥物的藥物數(shù)據(jù)輸入至所述第一自編碼器中進行編碼處理,以得到所述待測藥物生物屬性信息的第一向量表示;將所述第一向量表示輸入至所述第一多層感知機中進行處理,以得到第三向量表示;
將待測疾病的疾病數(shù)據(jù)輸入至所述第二自編碼器中進行編碼處理,以得到所述待測疾病生物屬性信息的第二向量表示;將所述第二向量表示輸入至所述第二多層感知機中進行處理,以得到第四向量表示;
將所述第三向量表示和所述第四向量表示輸入至所述第一解碼器中進行解碼處理,以確定所述待測藥物和所述待測疾病之間關聯(lián)關系。
2.如權利要求1所述的方法,其特征在于,所述預測模型中的所述第一自編碼器和所述第二自編碼器的訓練方法包括:
將預定藥物的藥物數(shù)據(jù)輸入至簡化分子線性輸入規(guī)范系統(tǒng)中以確定所述預定藥物的化學描述符,將所述化學描述符輸入至預定檢測工具,以得到所述預定藥物中是否存在預定化學結構的藥物數(shù)據(jù)的向量表示;將所述藥物數(shù)據(jù)的向量表示輸入至所述第一自編碼器進行第一訓練,以得到所述藥物數(shù)據(jù)的生物信息優(yōu)化表示;將所述藥物數(shù)據(jù)的生物信息優(yōu)化表示輸入至第二解碼器中進行解碼處理,以得到所述藥物數(shù)據(jù)的重構向量表示;其中,所述第一訓練的損失根據(jù)所述藥物數(shù)據(jù)的向量表示和所述藥物數(shù)據(jù)的重構向量表示確定;
根據(jù)醫(yī)學主題詞表確定預定疾病的生物屬性信息,采用有向無環(huán)圖的各個網格描述符描述所述生物屬性信息,并計算預定疾病和其它疾病的語義相似度,以得到所述預定疾病的疾病數(shù)據(jù)的向量表示;將所述疾病數(shù)據(jù)的向量表示輸入至所述第二自編碼器進行第二訓練,以得到所述疾病數(shù)據(jù)的生物信息優(yōu)化表示;將所述疾病數(shù)據(jù)的生物信息優(yōu)化表示輸入至第三解碼器中進行解碼處理,以得到所述疾病數(shù)據(jù)的重構向量表示;其中,所述第二訓練的損失根據(jù)所述疾病數(shù)據(jù)的向量表示和所述疾病數(shù)據(jù)的重構向量表示確定。
3.如權利要求2所述的方法,其特征在于,所述預測模型中的所述第一多層感知機和所述第二多層感知機的訓練方法包括:
使用深度游走算法從藥物疾病關聯(lián)的異構網絡中提取藥物和疾病的網絡拓撲結構表示,并按照隨機行走理論學習所述異構網絡中每個節(jié)點的序列表示,得到所述異構網絡里藥物節(jié)點的嵌入表示和疾病節(jié)點的嵌入表示;
將所述藥物數(shù)據(jù)的生物信息優(yōu)化表示輸入至所述第一多層感知機中進行第三訓練,以得到所述藥物數(shù)據(jù)的訓練后生物信息優(yōu)化表示;其中,所述第三訓練的損失根據(jù)所述藥物節(jié)點的嵌入表示和所述訓練后生物信息優(yōu)化表示確定;
將所述疾病數(shù)據(jù)的生物信息優(yōu)化表示輸入至所述第二多層感知機中進行第四訓練,以得到所述疾病數(shù)據(jù)的訓練后生物信息優(yōu)化表示;其中,所述第四訓練的損失根據(jù)所述疾病節(jié)點的嵌入表示和所述訓練后生物信息優(yōu)化表示確定。
4.如權利要求3所述的方法,其特征在于,所述預測模型中的所述第一解碼器的訓練方法包括:
將所述藥物數(shù)據(jù)的訓練后生物信息優(yōu)化表示和所述疾病數(shù)據(jù)的訓練后生物信息優(yōu)化表示輸入至具有預定預測概率得分矩陣的所述第一解碼器中進行第五訓練,以得到所述預定藥物和所述預定疾病之間關聯(lián)關系;其中,所述第五訓練的損失采用最小化加權二元交叉熵損失學習關聯(lián)關系。
5.一種使用預測模型預測疾病與藥物關聯(lián)關系的裝置,其特征在于,
所述預測模型包括:第一自編碼器、第二自編碼器、第一多層感知機、第二多層感知機、第一解碼器;
所述裝置包括:
藥物數(shù)據(jù)處理模塊,用于將待測藥物的藥物數(shù)據(jù)輸入至所述第一自編碼器中進行編碼處理,以得到所述待測藥物生物屬性信息的第一向量表示;將所述第一向量表示輸入至所述第一多層感知機中進行處理,以得到第三向量表示;
疾病數(shù)據(jù)處理模塊,用于將待測疾病的疾病數(shù)據(jù)輸入至所述第二自編碼器中進行編碼處理,以得到所述待測疾病生物屬性信息的第二向量表示;將所述第二向量表示輸入至所述第二多層感知機中進行處理,以得到第四向量表示;
確定模塊,用于將所述第三向量表示和所述第四向量表示輸入至所述第一解碼器中進行解碼處理,以確定所述待測藥物和所述待測疾病之間關聯(lián)關系。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于京東方科技集團股份有限公司,未經京東方科技集團股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202211050896.5/1.html,轉載請聲明來源鉆瓜專利網。





