[發(fā)明專利]一種基于交互表示學(xué)習(xí)的藥物特征表示方法在審
| 申請(qǐng)?zhí)枺?/td> | 202111126217.3 | 申請(qǐng)日: | 2021-09-26 |
| 公開(公告)號(hào): | CN113851197A | 公開(公告)日: | 2021-12-28 |
| 發(fā)明(設(shè)計(jì))人: | 劉世超;陳思;邱洋;薛一明;章文 | 申請(qǐng)(專利權(quán))人: | 華中農(nóng)業(yè)大學(xué) |
| 主分類號(hào): | G16C20/70 | 分類號(hào): | G16C20/70;G16C20/40;G06N3/04;G06N3/08 |
| 代理公司: | 湖北武漢永嘉專利代理有限公司 42102 | 代理人: | 崔友明 |
| 地址: | 430070 湖*** | 國(guó)省代碼: | 湖北;42 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 交互 表示 學(xué)習(xí) 藥物 特征 方法 | ||
本發(fā)明提供了一種基于交互表示學(xué)習(xí)的藥物特征表示方法,通過異構(gòu)圖表示學(xué)習(xí)和分子圖表示學(xué)習(xí)的雙向循環(huán)交互機(jī)制,充分整合利用多尺度的藥物特征表示,使藥物多尺度的藥物特征互補(bǔ)和融合,實(shí)現(xiàn)了從多尺度的藥物描述數(shù)據(jù)中獲取藥物的特征表示的功能。本發(fā)明針對(duì)豐富的藥物描述數(shù)據(jù),循環(huán)利用藥物的宏觀和微觀特征,同時(shí)開展藥物的異構(gòu)圖表示學(xué)習(xí)和分子圖表示學(xué)習(xí),充分利用藥物不同尺度的特征交互,融合藥物的宏觀維度數(shù)據(jù)和微觀維度數(shù)據(jù),從藥物描述數(shù)據(jù)中獲取藥物的特征表示,對(duì)下游的藥物發(fā)現(xiàn)和藥物設(shè)計(jì)具有重要的指導(dǎo)意義。
技術(shù)領(lǐng)域
本發(fā)明屬于圖表示學(xué)習(xí)和生物醫(yī)藥技術(shù)領(lǐng)域,具體涉及一種基于交互表示學(xué)習(xí)的藥物特征表示方法。
背景技術(shù)
藥物是人類預(yù)防、治療及診斷疾病的物質(zhì)。現(xiàn)實(shí)中存在大量與藥物相關(guān)的數(shù)據(jù)信息,如生物醫(yī)學(xué)文本、電子健康記錄、報(bào)告系統(tǒng)和公共數(shù)據(jù)庫(DrugBank、PubChem、KEGG等),包含豐富多樣的藥物理化數(shù)據(jù)、藥物靶點(diǎn)數(shù)據(jù)、藥物-藥物互作用數(shù)據(jù)、藥物代謝通路數(shù)據(jù)、藥物的蛋白酶數(shù)據(jù)和藥物的結(jié)構(gòu)數(shù)據(jù)等。這些數(shù)據(jù)能夠反映藥物的多尺度特性,如藥物靶點(diǎn)數(shù)據(jù)和蛋白酶數(shù)據(jù)可以體現(xiàn)藥物的某種特定功能特性,而藥物的結(jié)構(gòu)數(shù)據(jù)則蘊(yùn)含了藥物的生物活性,能夠從微觀的角度解釋藥物的特性。因此將藥物的描述數(shù)據(jù)大致分為宏觀維度數(shù)據(jù)和微觀維度數(shù)據(jù)。宏觀維度數(shù)據(jù)包含藥物靶點(diǎn)、蛋白酶和代謝通路等生化描述數(shù)據(jù),微觀維度數(shù)據(jù)包括藥物分子內(nèi)部多原子、多鍵的特征和結(jié)構(gòu)信息。藥物的宏觀特征表示和微觀特征表示代表了不同視角的描述信息,存在一定的互補(bǔ)和冗余。從多尺度的藥物描述數(shù)據(jù)中獲取藥物的特征表示,對(duì)下游的藥物發(fā)現(xiàn)和藥物設(shè)計(jì)具有重要的指導(dǎo)意義。
發(fā)明內(nèi)容
本發(fā)明要解決的技術(shù)問題是:提供一種基于交互表示學(xué)習(xí)的藥物特征表示方法,用于從多尺度的藥物描述數(shù)據(jù)中獲取藥物的特征表示。
本發(fā)明為解決上述技術(shù)問題所采取的技術(shù)方案為:一種基于交互表示學(xué)習(xí)的藥物特征表示方法,包括以下步驟:
S1:收集藥物的多尺度描述數(shù)據(jù);
S2:提取藥物的多尺度特征,包括采用異構(gòu)圖表示學(xué)習(xí)提取藥物的宏觀特征,采用分子圖表示學(xué)習(xí)提取藥物的微觀特征;
S3:使用多尺度數(shù)據(jù)的雙向循環(huán)交互學(xué)習(xí)機(jī)制,交互學(xué)習(xí)藥物的多尺度特征表示。
按上述方案,所述的步驟S1中,具體步驟為:
S11:從藥物數(shù)據(jù)庫DrugBank中獲取藥物互作用數(shù)據(jù)、藥物靶點(diǎn)數(shù)據(jù)和藥物酶數(shù)據(jù),并使用ID映射服務(wù)器將藥物的靶點(diǎn)映射到藥物數(shù)據(jù)庫KEGG DRUG中,獲得藥物的代謝通路數(shù)據(jù);
S12:從藥物數(shù)據(jù)庫BioGRID中獲取藥物和蛋白質(zhì)相互作用的數(shù)據(jù),將上述藥物描述數(shù)據(jù)和它們之間各種類型的關(guān)系構(gòu)建成異構(gòu)的藥物關(guān)聯(lián)網(wǎng)絡(luò),獲得藥物的宏觀維度數(shù)據(jù);
S13:從藥物數(shù)據(jù)庫PubChem中獲取每個(gè)藥物分子的規(guī)范SMILES表示并進(jìn)行預(yù)處理,將SMILES字符串依次轉(zhuǎn)換為分子結(jié)構(gòu)圖和圖數(shù)據(jù)結(jié)構(gòu)的表示形式,采用節(jié)點(diǎn)和邊分別表示原子和化學(xué)鍵,得到藥物的微觀維度數(shù)據(jù)。
按上述方案,所述的步驟S2中,提取藥物的宏觀特征的具體步驟為:
S21:構(gòu)建面向異構(gòu)圖的表示學(xué)習(xí)模型;
設(shè)所有節(jié)點(diǎn)類型的集合為O,將每個(gè)節(jié)點(diǎn)vi∈V劃分為特定的節(jié)點(diǎn)類型;所有鏈接類型的集合為R,將每個(gè)鏈接e∈E劃分為特定的鏈接類型;設(shè)描述藥物的異構(gòu)網(wǎng)絡(luò)G=(V,E)與節(jié)點(diǎn)類型映射函數(shù)ε:V→O和鏈接類型映射函數(shù)ψ:E→R相關(guān);將藥物的互作用數(shù)據(jù)、靶點(diǎn)、酶和代謝通路特征構(gòu)建為藥物的異構(gòu)關(guān)聯(lián)網(wǎng)絡(luò);
采用藥物的異構(gòu)圖表示學(xué)習(xí)模型為每個(gè)節(jié)點(diǎn)學(xué)習(xí)一個(gè)特征表示即映射函數(shù):
設(shè)|R|>1,Er包含屬于類型r∈R的所有鏈接,則:
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于華中農(nóng)業(yè)大學(xué),未經(jīng)華中農(nóng)業(yè)大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202111126217.3/2.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 根據(jù)用戶學(xué)習(xí)效果動(dòng)態(tài)變化下載學(xué)習(xí)數(shù)據(jù)的系統(tǒng)及方法
- 用于智能個(gè)人化學(xué)習(xí)服務(wù)的方法
- 漸進(jìn)式學(xué)習(xí)管理方法及漸進(jìn)式學(xué)習(xí)系統(tǒng)
- 輔助學(xué)習(xí)的方法及裝置
- 基于人工智能的課程推薦方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 基于強(qiáng)化學(xué)習(xí)的自適應(yīng)移動(dòng)學(xué)習(xí)路徑生成方法
- 一種線上視頻學(xué)習(xí)系統(tǒng)
- 一種基于校園大數(shù)據(jù)的自適應(yīng)學(xué)習(xí)方法、裝置及設(shè)備
- 一種學(xué)習(xí)方案推薦方法、裝置、設(shè)備和存儲(chǔ)介質(zhì)
- 游戲?qū)W習(xí)效果評(píng)測(cè)方法及系統(tǒng)





