[發(fā)明專利]一種基于交互表示學(xué)習(xí)的藥物特征表示方法在審
| 申請?zhí)枺?/td> | 202111126217.3 | 申請日: | 2021-09-26 |
| 公開(公告)號: | CN113851197A | 公開(公告)日: | 2021-12-28 |
| 發(fā)明(設(shè)計(jì))人: | 劉世超;陳思;邱洋;薛一明;章文 | 申請(專利權(quán))人: | 華中農(nóng)業(yè)大學(xué) |
| 主分類號: | G16C20/70 | 分類號: | G16C20/70;G16C20/40;G06N3/04;G06N3/08 |
| 代理公司: | 湖北武漢永嘉專利代理有限公司 42102 | 代理人: | 崔友明 |
| 地址: | 430070 湖*** | 國省代碼: | 湖北;42 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 交互 表示 學(xué)習(xí) 藥物 特征 方法 | ||
1.一種基于交互表示學(xué)習(xí)的藥物特征表示方法,其特征在于:包括以下步驟:
S1:收集藥物的多尺度描述數(shù)據(jù);
S2:提取藥物的多尺度特征,包括采用異構(gòu)圖表示學(xué)習(xí)提取藥物的宏觀特征,采用分子圖表示學(xué)習(xí)提取藥物的微觀特征;
S3:使用多尺度數(shù)據(jù)的雙向循環(huán)交互學(xué)習(xí)機(jī)制,交互學(xué)習(xí)藥物的多尺度特征表示。
2.根據(jù)權(quán)利要求1所述的一種基于交互表示學(xué)習(xí)的藥物特征表示方法,其特征在于:所述的步驟S1中,具體步驟為:
S11:從藥物數(shù)據(jù)庫DrugBank中獲取藥物互作用數(shù)據(jù)、藥物靶點(diǎn)數(shù)據(jù)和藥物酶數(shù)據(jù),并使用ID映射服務(wù)器將藥物的靶點(diǎn)映射到藥物數(shù)據(jù)庫KEGG DRUG中,獲得藥物的代謝通路數(shù)據(jù);
S12:從藥物數(shù)據(jù)庫BioGRID中獲取藥物和蛋白質(zhì)相互作用的數(shù)據(jù),將上述藥物描述數(shù)據(jù)和它們之間各種類型的關(guān)系構(gòu)建成異構(gòu)的藥物關(guān)聯(lián)網(wǎng)絡(luò),獲得藥物的宏觀維度數(shù)據(jù);
S13:從藥物數(shù)據(jù)庫PubChem中獲取每個(gè)藥物分子的規(guī)范SMILES表示并進(jìn)行預(yù)處理,將SMILES字符串依次轉(zhuǎn)換為分子結(jié)構(gòu)圖和圖數(shù)據(jù)結(jié)構(gòu)的表示形式,采用節(jié)點(diǎn)和邊分別表示原子和化學(xué)鍵,得到藥物的微觀維度數(shù)據(jù)。
3.根據(jù)權(quán)利要求1所述的一種基于交互表示學(xué)習(xí)的藥物特征表示方法,其特征在于:所述的步驟S2中,提取藥物的宏觀特征的具體步驟為:
S21:構(gòu)建面向異構(gòu)圖的表示學(xué)習(xí)模型;
設(shè)所有節(jié)點(diǎn)類型的集合為O,將每個(gè)節(jié)點(diǎn)vi∈V劃分為特定的節(jié)點(diǎn)類型;所有鏈接類型的集合為R,將每個(gè)鏈接e∈E劃分為特定的鏈接類型;設(shè)描述藥物的異構(gòu)網(wǎng)絡(luò)G=(V,E)與節(jié)點(diǎn)類型映射函數(shù)ε:V→O和鏈接類型映射函數(shù)ψ:E→R相關(guān);將藥物的互作用數(shù)據(jù)、靶點(diǎn)、酶和代謝通路特征構(gòu)建為藥物的異構(gòu)關(guān)聯(lián)網(wǎng)絡(luò);
采用藥物的異構(gòu)圖表示學(xué)習(xí)模型為每個(gè)節(jié)點(diǎn)學(xué)習(xí)一個(gè)特征表示即映射函數(shù):
設(shè)|R|>1,Er包含屬于類型r∈R的所有鏈接,則:
E=∪r∈REr,
將異構(gòu)網(wǎng)絡(luò)根據(jù)鏈接的類型劃分為多個(gè)子網(wǎng)絡(luò):
Gr=(V,Er);
為每個(gè)節(jié)點(diǎn)在每種鏈接的類型上學(xué)習(xí)到統(tǒng)一的低維向量表示,并整合得到節(jié)點(diǎn)的宏觀特征表示;
設(shè)節(jié)點(diǎn)vi在鏈接類型r上的鄰居節(jié)點(diǎn)集合為Ni,r,通過隨機(jī)初始化得到每個(gè)節(jié)點(diǎn)在鏈接類型r上的初始向量表示設(shè)aggregator函數(shù)為聚合函數(shù),用于采用包括平均、池化的方式聚合信息;update函數(shù)為更新函數(shù);
將鏈接類型r上的節(jié)點(diǎn)vi在鏈接類型r上的鄰居信息聚合、更新得到第k階向量表示為則定義更新公式如下:
經(jīng)過K次迭代后,節(jié)點(diǎn)vi在鏈接類型r上的向量表示ui,r等價(jià)于設(shè)M為鏈接類型的數(shù)目,拼接節(jié)點(diǎn)vi在所有鏈接類型上的向量表示,得到節(jié)點(diǎn)的特征向量表示Ui:
S22:采用基于注意力機(jī)制的圖神經(jīng)網(wǎng)絡(luò)框架,通過注意力機(jī)制聚合不同類型的邊的信息提取藥物節(jié)點(diǎn)的宏觀特征表示;
設(shè)wr和Wr對于鏈接類型r是可訓(xùn)練的參數(shù),采用自注意力機(jī)制計(jì)算節(jié)點(diǎn)的特征向量表示Ui中的線性組合的系數(shù)即鏈接類型r對節(jié)點(diǎn)vi的注意力權(quán)重:
設(shè)Dr是可訓(xùn)練的轉(zhuǎn)化矩陣,則節(jié)點(diǎn)vi在鏈接類型r上的向量表示為:
則節(jié)點(diǎn)vi在異構(gòu)圖上學(xué)習(xí)到藥物的宏觀特征表示為:
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于華中農(nóng)業(yè)大學(xué),未經(jīng)華中農(nóng)業(yè)大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202111126217.3/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 根據(jù)用戶學(xué)習(xí)效果動態(tài)變化下載學(xué)習(xí)數(shù)據(jù)的系統(tǒng)及方法
- 用于智能個(gè)人化學(xué)習(xí)服務(wù)的方法
- 漸進(jìn)式學(xué)習(xí)管理方法及漸進(jìn)式學(xué)習(xí)系統(tǒng)
- 輔助學(xué)習(xí)的方法及裝置
- 基于人工智能的課程推薦方法、裝置、設(shè)備及存儲介質(zhì)
- 基于強(qiáng)化學(xué)習(xí)的自適應(yīng)移動學(xué)習(xí)路徑生成方法
- 一種線上視頻學(xué)習(xí)系統(tǒng)
- 一種基于校園大數(shù)據(jù)的自適應(yīng)學(xué)習(xí)方法、裝置及設(shè)備
- 一種學(xué)習(xí)方案推薦方法、裝置、設(shè)備和存儲介質(zhì)
- 游戲?qū)W習(xí)效果評測方法及系統(tǒng)





