[發(fā)明專利]一種用于DTA預(yù)測(cè)的多模態(tài)信息融合模型及方法在審
| 申請(qǐng)?zhí)枺?/td> | 202310188140.5 | 申請(qǐng)日: | 2023-03-02 |
| 公開(公告)號(hào): | CN116206688A | 公開(公告)日: | 2023-06-02 |
| 發(fā)明(設(shè)計(jì))人: | 歐陽純萍;劉永彬;張琳琳;萬亞平;田紋龍;余穎 | 申請(qǐng)(專利權(quán))人: | 南華大學(xué) |
| 主分類號(hào): | G16B40/00 | 分類號(hào): | G16B40/00;G16B15/30;G06N3/0455;G06N3/0464;G06N3/08;G06N3/048;G06N3/047 |
| 代理公司: | 長(zhǎng)沙新裕知識(shí)產(chǎn)權(quán)代理有限公司 43210 | 代理人: | 顏田慶 |
| 地址: | 421001 湖*** | 國(guó)省代碼: | 湖南;43 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 用于 dta 預(yù)測(cè) 多模態(tài) 信息 融合 模型 方法 | ||
1.一種用于DTA預(yù)測(cè)的多模態(tài)信息融合模型,其特征在于,包括藥物分子結(jié)構(gòu)信息編碼器、靶標(biāo)結(jié)構(gòu)信息編碼器、多模態(tài)平衡模塊和藥物靶標(biāo)融合模塊;
所述藥物分子結(jié)構(gòu)信息編碼器使用Transformer模型對(duì)藥物字符串模態(tài)信息進(jìn)行編碼,并使用GIN模型提取藥物圖模態(tài)信息特征;
所述靶標(biāo)結(jié)構(gòu)信息編碼器使用Transformer模型對(duì)靶標(biāo)字符串模態(tài)信息進(jìn)行編碼,并使用GCN模型提取藥物圖模態(tài)信息特征;
所述多模態(tài)平衡模塊使用對(duì)比學(xué)習(xí)的方法將藥物字符串和圖模態(tài)信息進(jìn)行平衡與整合,以及將靶標(biāo)字符串和圖模態(tài)信息進(jìn)行平衡與整合;
所述藥物靶標(biāo)融合模塊將多模態(tài)平衡模塊得到的藥物和靶標(biāo)的兩種模態(tài)特征連接起來,用于DTA預(yù)測(cè)。
2.一種用于DTA預(yù)測(cè)的多模態(tài)信息融合方法,其特征在于,包括:
步驟S1,字符串模態(tài)的嵌入;
將藥物SMILES代碼視為字符串,對(duì)其進(jìn)行整數(shù)編碼,融入該編碼的位置編碼得到向量表示,通過Transformer模型對(duì)該向量進(jìn)行特征提取得到SMILES字符串的最終向量表示;
將靶標(biāo)序列視為字符串,對(duì)其進(jìn)行整數(shù)編碼,融入該編碼的位置編碼得到向量表示,通過Transformer模型對(duì)該向量進(jìn)行特征提取得到靶標(biāo)字符串的最終向量表示;
步驟S2,圖模態(tài)的嵌入;
將每個(gè)原子作為藥物分子圖中的節(jié)點(diǎn),原子間的聯(lián)系作為藥物分子圖的鄰接矩陣,并將原子的屬性作為藥物分子圖節(jié)點(diǎn)的屬性特征;將藥物分子圖和其節(jié)點(diǎn)的特征向量作為輸入,通過GIN模型進(jìn)行節(jié)點(diǎn)嵌入,得到藥物分子圖的表示向量;
將每個(gè)殘基作為靶標(biāo)結(jié)構(gòu)圖中的節(jié)點(diǎn),殘基對(duì)間是否接觸的概率作為靶標(biāo)結(jié)構(gòu)圖的鄰接矩陣,并將每個(gè)殘基位置通過序列比對(duì)結(jié)果進(jìn)行評(píng)分,作為靶標(biāo)結(jié)構(gòu)圖節(jié)點(diǎn)的屬性特征;將靶標(biāo)結(jié)構(gòu)圖和其節(jié)點(diǎn)的特征向量作為輸入,通過GCN模型進(jìn)行節(jié)點(diǎn)嵌入,得到靶標(biāo)結(jié)構(gòu)圖的表示向量;
步驟S3,多模態(tài)表示的對(duì)比學(xué)習(xí)和表示的融合;
通過最大化字符串模態(tài)和圖模態(tài)的一致性來學(xué)習(xí)特征表示,分別得到藥物和靶標(biāo)的兩種模態(tài)最終的表示之后,將其進(jìn)行拼接,得到用于DTA預(yù)測(cè)的藥物和靶標(biāo)模態(tài)信息。
3.根據(jù)權(quán)利要求2所述的用于DTA預(yù)測(cè)的多模態(tài)信息融合方法,其特征在于:步驟S1中,在對(duì)藥物和靶標(biāo)字符串進(jìn)行整數(shù)編碼之后,利用藥物原子和靶標(biāo)殘基的排列信息來捕獲字符串模態(tài)的位置信息,并通過Transformer模型從輸入中學(xué)習(xí)不同級(jí)別的抽象特征,再應(yīng)用最大池化層來獲得藥物和靶標(biāo)字符串的最終向量表示。
4.根據(jù)權(quán)利要求3所述的用于DTA預(yù)測(cè)的多模態(tài)信息融合方法,其特征在于:步驟S1中,采用如下公式表示字符串模態(tài)的位置信息:
PE(pos,2i)=sin(pos/100002i/dmodel)????(1)
PE(pos,2i+1)=cos(pos/100002i/dmodel)????(2)
其中,pos代表字符串中的字符,i是字符編碼的維度,dmodel是該字符的編碼。
5.根據(jù)權(quán)利要求4所述的用于DTA預(yù)測(cè)的多模態(tài)信息融合方法,其特征在于:所述Transformer模型包括一個(gè)MSA層和一個(gè)MLP塊,所述MSA層的函數(shù)表示為:
zm=MSA(LN(zl-1))+zl-1,l=1...L????(3)
其中,zl-1表示MSA層的輸入,zm表示MSA的輸出,LN表示歸一化層,L表示輸入長(zhǎng)度的批次;
所述MLP塊包含兩個(gè)CNN層和一個(gè)歸一化層,其函數(shù)表示為:
zl=MLP(LN(zm))+zm,l=1...L????(4)
其中,zl表示MLP的輸出。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于南華大學(xué),未經(jīng)南華大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202310188140.5/1.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 一種測(cè)量非晶態(tài)合金玻璃化轉(zhuǎn)變溫度的熱分析方法
- 帶柔性塑料材料制造的覆蓋件的托載貨物機(jī)器人封裝方法和機(jī)器
- 透明色調(diào)劑、圖像形成方法和色調(diào)劑組
- 固體中微量有機(jī)氣體的定性與定量分析的方法
- 一種動(dòng)態(tài)時(shí)間分配方法及裝置
- 一種基于上位機(jī)控制片劑發(fā)藥系統(tǒng)隨機(jī)補(bǔ)藥方法
- 一種利用熱分析法評(píng)價(jià)催化劑的方法
- (DTA)<sub>7</sub>[PW<sub>10</sub>(TiO<sub>2</sub>)<sub>2</sub>O<sub>38</sub>]/TiO<sub>2</sub>復(fù)合納米纖維及其制備方法
- 拉手(DTA)
- 一種盾構(gòu)通用型管片選點(diǎn)模型的構(gòu)建方法及其應(yīng)用
- 圖像編碼裝置、圖像編碼方法、圖像譯碼裝置、圖像譯碼方法、程序以及記錄介質(zhì)
- 圖像編碼裝置、圖像編碼方法、圖像譯碼裝置、圖像譯碼方法
- 圖像編碼裝置、圖像編碼方法、圖像譯碼裝置、圖像譯碼方法
- 基于時(shí)間序列預(yù)測(cè)模型適用性量化的預(yù)測(cè)模型選擇方法
- 圖像編碼裝置、圖像編碼方法、圖像譯碼裝置、圖像譯碼方法
- 分類預(yù)測(cè)方法及裝置、預(yù)測(cè)模型訓(xùn)練方法及裝置
- 幀內(nèi)預(yù)測(cè)的方法及裝置
- 圖像預(yù)測(cè)方法及裝置、電子設(shè)備和存儲(chǔ)介質(zhì)
- 文本預(yù)測(cè)方法、裝置以及電子設(shè)備
- 模型融合方法、預(yù)測(cè)方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 用于智能機(jī)器人系統(tǒng)多模態(tài)輸出的方法及裝置
- 一種基于深度學(xué)習(xí)的多模態(tài)醫(yī)學(xué)影像識(shí)別方法及裝置
- 一種基于多模態(tài)生成式對(duì)抗網(wǎng)絡(luò)的云圖分類方法
- 一種基于多模態(tài)信息的食道功能性疾病診斷系統(tǒng)
- 一種有監(jiān)督的快速離散多模態(tài)哈希檢索方法和系統(tǒng)
- 一種多模態(tài)數(shù)據(jù)處理方法及系統(tǒng)
- 一種基于多模態(tài)學(xué)習(xí)的電力攻擊識(shí)別方法
- 多源多模態(tài)數(shù)據(jù)的處理系統(tǒng)及應(yīng)用該系統(tǒng)的方法
- 一種基于門機(jī)制多模態(tài)融合的情感分析方法
- 面向?qū)捰蝻w行的多模態(tài)精確劃分方法





