[發(fā)明專利]基于生物醫(yī)學文獻和領域知識數(shù)據(jù)的藥物重定位預測方法在審
| 申請?zhí)枺?/td> | 202010344114.3 | 申請日: | 2020-04-27 | 
| 公開(公告)號: | CN111554360A | 公開(公告)日: | 2020-08-18 | 
| 發(fā)明(設計)人: | 張益嘉;于子洋;熊振康;楊宏偉;王健 | 申請(專利權)人: | 大連理工大學 | 
| 主分類號: | G16C20/70 | 分類號: | G16C20/70;G06N3/04;G06F40/295;G06F40/30 | 
| 代理公司: | 大連理工大學專利中心 21200 | 代理人: | 隋秀文;溫福雪 | 
| 地址: | 116024 遼*** | 國省代碼: | 遼寧;21 | 
| 權利要求書: | 查看更多 | 說明書: | 查看更多 | 
| 摘要: | |||
| 搜索關鍵詞: | 基于 生物醫(yī)學 文獻 領域 知識 數(shù)據(jù) 藥物 定位 預測 方法 | ||
本發(fā)明屬于生物醫(yī)學文獻技術領域,具體涉及一種基于生物醫(yī)學文獻和領域知識數(shù)據(jù)的藥物重定位預測方法。本發(fā)明基于深度學習模型和Attention機制,抽取生物醫(yī)學文獻中的藥物重定位信息;基于異構(gòu)網(wǎng)絡模型,整合生物醫(yī)學文獻知識和領域數(shù)據(jù);基于元路徑模型和機器學習方法,在異構(gòu)藥物重定位關系網(wǎng)絡中預測藥物與疾病隱含作用關系。本發(fā)明解決了當前藥物重定位預測中無法有效整合非結(jié)構(gòu)化文本數(shù)據(jù)和結(jié)構(gòu)化領域數(shù)據(jù)源的問題,能夠充分利用生物醫(yī)學文獻和領域數(shù)據(jù)提升藥物重定位預測的準確性。
技術領域
本發(fā)明屬于生物醫(yī)學文獻技術領域,具體涉及一種基于生物醫(yī)學文獻和領域知識數(shù)據(jù)的藥物重定位預測方法。
背景技術
藥物重定位是指利用相關技術方法從已有的藥物挖掘其新適應癥的過程。與傳統(tǒng)的藥物研發(fā)方法相比,藥物重定位是基于已有藥物的重新挖掘,因而能夠有效地降低藥物研發(fā)的周期、成本和風險,是突破新藥開發(fā)高投入低產(chǎn)出困境的有效方法之一。
生物醫(yī)學文獻作為生物醫(yī)學領域成果展示和學術交流的最主要方式,其數(shù)目之大,增長速度之快遠遠超過了其他學科領域。另一方面,以藥物靶標數(shù)據(jù)、藥物副作用數(shù)據(jù)為代表的領域數(shù)據(jù),主要來自于醫(yī)學實驗測定和篩選,與生物醫(yī)學文獻知識存在較強的互補性。這些領域數(shù)據(jù)與藥物重定位研究密切相關,能夠從不同角度為藥物與疾病的關系預測引入先驗知識,提高藥物重定位預測的準確性。
發(fā)明內(nèi)容
為解決目前藥物重定位預測方法無法有效整合非結(jié)構(gòu)化文本數(shù)據(jù)和結(jié)構(gòu)化領域數(shù)據(jù)源的主要問題,本發(fā)明提出融合生物醫(yī)學文獻數(shù)據(jù)和領域知識源的藥物重定位預測方法。本發(fā)明基于自然語言處理技術、深度學習,通過整合生物醫(yī)學知識和領域數(shù)據(jù)構(gòu)建異構(gòu)藥物重定位網(wǎng)絡,采用元路徑模型和機器學習方法預測藥物與疾病的未知作用關系,最終實現(xiàn)藥物重定位預測。
本發(fā)明的技術方案:
一種基于生物醫(yī)學文獻和領域知識數(shù)據(jù)的藥物重定位預測方法,具體步驟如下:
S1)使用分布式文本表示學習方法來學習詞向量作為深度神經(jīng)網(wǎng)絡模型的輸入,在雙向LSTM模型的基礎上結(jié)合CRF模型(BLSTM-CRF),對生物醫(yī)學數(shù)據(jù)庫中的命名實體進行高精度識別,找到最佳標簽序列。利用UMLS、MESH等生物醫(yī)學語義資源,基于語義消歧等方法,實現(xiàn)生物醫(yī)學實體名稱標準化。
S2)在步驟S1)對生物醫(yī)學數(shù)據(jù)庫中的疾病、藥物、基因?qū)嶓w名進行識別及其標準化的基礎上,建立基于雙路Attention機制的實體關系抽取模型,從生物醫(yī)學數(shù)據(jù)庫中抽取疾病、藥物、基因之間的語義關系。
S3)通過構(gòu)建異構(gòu)網(wǎng)絡來融合步驟S2)產(chǎn)生的多種類型的實體和實體關系。
S4)建立面向步驟S3)所構(gòu)建的異構(gòu)生物醫(yī)學知識網(wǎng)絡的元路徑模型,將藥物與疾病未知作用關系之間存在的元路徑模式,表示為藥物與疾病未知作用關系的特征,最終文獻知識與領域數(shù)據(jù)有機融合為藥物與疾病未知作用關系相應的特征向量。
S5)在步驟S4)得到藥物與疾病關系的特征向量表示后,基于機器學習理論,使用現(xiàn)有的樣本數(shù)據(jù),訓練得到藥物重定位預測模型,對候選的藥物與疾病未知作用關系進行二元分類,最終實現(xiàn)藥物重定位的預測。
本發(fā)明的開發(fā)及部署端為Python平臺。
本發(fā)明的實體識別模型為雙向LSTM模型、CRF模型(BLSTM-CRF)。
本發(fā)明的生物醫(yī)學語義資源和開源工具包括UMLS、MESH。
本發(fā)明使用的生物醫(yī)學數(shù)據(jù)庫包括MEDLINE、DRUGBANK、SIDER、Gene Ontology和KEGG。
本發(fā)明建立的模型為異構(gòu)網(wǎng)絡元路徑模型、卷積神經(jīng)網(wǎng)絡模型、藥物重定位預測模型。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于大連理工大學,未經(jīng)大連理工大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010344114.3/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 上一篇:晶圓前端傳送系統(tǒng)
 - 下一篇:顯示面板及其制備方法、顯示裝置
 
- 從聚合生物醫(yī)學裝置中萃取可萃取材料的裝置、組合件和方法
 - 基于生物可吸收基質(zhì)的可植入生物醫(yī)學裝置
 - 基于生物可吸收基質(zhì)的可植入生物醫(yī)學裝置
 - 基于生物可吸收基質(zhì)的可植入生物醫(yī)學裝置
 - 用于生物醫(yī)學模擬的系統(tǒng)和方法
 - 一種生物醫(yī)學知識庫的信息更新方法及系統(tǒng)
 - 基于上下文向量圖核的生物醫(yī)學實體關系分類方法
 - 生物醫(yī)學實體展示平臺的構(gòu)建方法、裝置和計算機設備
 - 基于預訓練模型和自注意力機制的生物醫(yī)學關系抽取方法
 - 基于文獻的癌癥相關生物醫(yī)學事件數(shù)據(jù)庫構(gòu)建方法
 





