[發(fā)明專利]基于門控注意力機(jī)制的靶標(biāo)-配體結(jié)合親和力的深度學(xué)習(xí)預(yù)測方法在審
| 申請(qǐng)?zhí)枺?/td> | 202210394865.5 | 申請(qǐng)日: | 2022-04-15 |
| 公開(公告)號(hào): | CN114743600A | 公開(公告)日: | 2022-07-12 |
| 發(fā)明(設(shè)計(jì))人: | 劉奇磊;都健;趙雨靚;張磊;吳心遠(yuǎn);孟慶偉 | 申請(qǐng)(專利權(quán))人: | 大連理工大學(xué) |
| 主分類號(hào): | G16B40/00 | 分類號(hào): | G16B40/00;G16B5/00;G16B15/00;G16B50/00;G06K9/62;G06N3/04;G06N3/08 |
| 代理公司: | 遼寧鴻文知識(shí)產(chǎn)權(quán)代理有限公司 21102 | 代理人: | 王海波 |
| 地址: | 116024 遼*** | 國省代碼: | 遼寧;21 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 基于 門控 注意力 機(jī)制 靶標(biāo) 結(jié)合 親和力 深度 學(xué)習(xí) 預(yù)測 方法 | ||
1.基于門控注意力機(jī)制的靶標(biāo)-配體結(jié)合親和力的深度學(xué)習(xí)預(yù)測方法,其特征在于,包括以下具體步驟:
步驟1:建立結(jié)合親和力數(shù)據(jù)庫,用于后續(xù)的深度學(xué)習(xí)模型;
步驟2:將配體的SMILES字符串轉(zhuǎn)換為配體矩陣,作為深度學(xué)習(xí)模型的輸入;
步驟3:將蛋白質(zhì)的氨基酸序列轉(zhuǎn)換為蛋白質(zhì)矩陣,作為深度學(xué)習(xí)模型的輸入;
步驟4:構(gòu)建用于模型訓(xùn)練的深度學(xué)習(xí)模型的架構(gòu),將配體矩陣送到一個(gè)全連接層和一個(gè)基于門增強(qiáng)的注意力層用于特征提取,通過矩陣行的加和方式來聚合配體片段的特征向量;
步驟5:將蛋白質(zhì)矩陣先送到一維卷積層和最大池化層,以減少蛋白質(zhì)矩陣的行數(shù),然后再送入基于門增強(qiáng)的注意力層用于特征提取,通過矩陣行的加和方式來聚合蛋白質(zhì)高階氨基酸的特征向量;
步驟6:將聚合后的配體片段的特征向量與蛋白質(zhì)高階氨基酸的特征向量拼接在一起送入后續(xù)的全連接層以預(yù)測靶標(biāo)-配體復(fù)合物的高/低結(jié)合親和力的概率。
2.根據(jù)權(quán)利要求1所述的基于門控注意力機(jī)制的靶標(biāo)-配體結(jié)合親和力的深度學(xué)習(xí)預(yù)測方法,其特征在于,步驟1具體包括:根據(jù)以下標(biāo)準(zhǔn)對(duì)結(jié)合親和力數(shù)據(jù)庫進(jìn)行預(yù)處理:
步驟1.1:刪除涉及IC50性質(zhì)的條目,保留涉及Ki和Kd性質(zhì)的條目;
步驟1.2:刪除RDKit工具讀取配體結(jié)構(gòu)文件失敗或Mol2vec方法找不到配體Morgen片段的條目;
步驟1.3:分別刪除Morgen片段或氨基酸數(shù)大于閾值的靶標(biāo)-配體復(fù)合物條目;
步驟1.4:Ki/dn的靶標(biāo)-配體復(fù)合物標(biāo)記為高結(jié)合親和力,用“1”表示,而Ki/d≥n的靶標(biāo)-配體復(fù)合物標(biāo)記為低結(jié)合親和力,用“0”表示,Ki/d表示Ki或Kd,n表示抑制或解離常數(shù)閾值;
最后,在應(yīng)用上述步驟1.1-1.4標(biāo)準(zhǔn)后,獲得獨(dú)特的靶標(biāo)-配體復(fù)合物樣本存儲(chǔ)在結(jié)合親和力數(shù)據(jù)庫中,用于后續(xù)的深度學(xué)習(xí)模型。
3.根據(jù)權(quán)利要求1所述的基于門控注意力機(jī)制的靶標(biāo)-配體結(jié)合親和力的深度學(xué)習(xí)預(yù)測方法,其特征在于,步驟2具體包括:
步驟2.1:使用Morgan算法將分子的SMILES字符串表示轉(zhuǎn)換為Morgen片段;
步驟2.2:將Mol2vec中的Morgen片段的特征向量嵌入到步驟2.1得到的Morgen片段中;將每個(gè)分子的Morgen片段的特征向量求和來表示整個(gè)分子的特征向量;
步驟2.3:基于Mol2vec描述符,每個(gè)配體樣本由一個(gè)二維矩陣表示,其中矩陣行表示Morgen片段,矩陣列表示片段的特征向量。
4.根據(jù)權(quán)利要求1所述的基于門控注意力機(jī)制的靶標(biāo)-配體結(jié)合親和力的深度學(xué)習(xí)預(yù)測方法,其特征在于,步驟3具體包括:
步驟3.1:將蛋白質(zhì)序列中每三個(gè)相鄰的氨基酸視為一個(gè)高階氨基酸;通過這種方式,將結(jié)合親和力數(shù)據(jù)庫中的蛋白質(zhì)編寫成高階氨基酸字符串;
步驟3.2:通過深度學(xué)習(xí)模型中的嵌入方法,給每個(gè)高階氨基酸字符串嵌入一個(gè)特征向量;
步驟3.3:每個(gè)蛋白質(zhì)樣本由一個(gè)二維矩陣表示,其中,矩陣行表示高階氨基酸字符串,矩陣列表示高階氨基酸字符串的特征向量。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于大連理工大學(xué),未經(jīng)大連理工大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202210394865.5/1.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 基于粒子濾波視覺注意力模型的運(yùn)動(dòng)目標(biāo)檢測方法
- 一種評(píng)測注意力狀態(tài)的方法及裝置
- 注意力測評(píng)方法、系統(tǒng)及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)
- 兒童注意力評(píng)估系統(tǒng)及其方法
- 一種注意力檢測方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 一種注意力識(shí)別方法和裝置
- 一種可靠的用戶注意力監(jiān)測估計(jì)表示模型
- 注意力特征圖獲取方法及裝置、目標(biāo)檢測的方法及裝置
- 基于通道增強(qiáng)的雙注意力生成對(duì)抗網(wǎng)絡(luò)及圖像生成方法
- 一種文本情感分析模型的優(yōu)化方法及裝置
- 一種機(jī)制蛋的制造方法
- 手機(jī)制式的校準(zhǔn)方法、系統(tǒng)及手機(jī)檢測設(shè)備
- 一種考慮激勵(lì)機(jī)制電量電價(jià)彈性矩陣的耗電量估測方法
- 選擇區(qū)塊鏈共識(shí)機(jī)制的方法、裝置以及共識(shí)節(jié)點(diǎn)
- 一種復(fù)合改性機(jī)制砂及其制備方法
- 一種存儲(chǔ)設(shè)備糾錯(cuò)方法及糾錯(cuò)裝置
- 區(qū)塊鏈中共識(shí)機(jī)制的處理方法、裝置和電子設(shè)備
- 一種建筑用機(jī)制砂整形裝置
- 通信方法、通信裝置及存儲(chǔ)介質(zhì)
- 一種網(wǎng)絡(luò)預(yù)約出租車市場準(zhǔn)入機(jī)制的優(yōu)化方法及系統(tǒng)





