[發(fā)明專利]一種結(jié)合多任務(wù)學(xué)習(xí)和自注意力機(jī)制的蛋白質(zhì)功能預(yù)測方法有效
| 申請?zhí)枺?/td> | 202011467595.3 | 申請日: | 2020-12-14 |
| 公開(公告)號: | CN112562784B | 公開(公告)日: | 2023-08-15 |
| 發(fā)明(設(shè)計)人: | 楊躍東;黃偉林;趙慧英;盧宇彤 | 申請(專利權(quán))人: | 中山大學(xué) |
| 主分類號: | G16B20/00 | 分類號: | G16B20/00;G16B40/00;G16B50/30 |
| 代理公司: | 廣州粵高專利商標(biāo)代理有限公司 44102 | 代理人: | 張金福 |
| 地址: | 510260 廣東*** | 國省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 結(jié)合 任務(wù) 學(xué)習(xí) 注意力 機(jī)制 蛋白質(zhì) 功能 預(yù)測 方法 | ||
1.一種結(jié)合多任務(wù)學(xué)習(xí)和自注意力機(jī)制的蛋白質(zhì)功能預(yù)測方法,其特征在于,包括以下步驟:
S1:根據(jù)分子功能類別MF預(yù)測任務(wù)、生物學(xué)過程類別BP預(yù)測任務(wù)和細(xì)胞組件類別CC預(yù)測任務(wù),構(gòu)建基于多任務(wù)學(xué)習(xí)和自注意力機(jī)制的蛋白質(zhì)功能預(yù)測系統(tǒng)模型;
S2:獲取樣本數(shù)據(jù)集,提取樣本數(shù)據(jù)集中蛋白質(zhì)序列的特征信息,組建訓(xùn)練集和測試集;
所述蛋白質(zhì)的序列的特征信息包括氨基酸序列、位置特異性打分矩陣、隱藏馬爾科夫模型的序列譜和由SPIDER3預(yù)測的蛋白質(zhì)的結(jié)構(gòu)信息,分別記作“?Seq”、“?PSSM”、“?HMM”和“?SPIDER3”;
其中,Seq為氨基酸序列的one-hot編碼,表示為L×20的矩陣,L為序列長度;
PSSM為通過在UniRef90數(shù)據(jù)庫上運(yùn)行PSI-BLAST對每個蛋白質(zhì)進(jìn)行迭代搜索生成的特征,表示為L×20的矩陣,L為序列長度;
HMM為通過在Uniclust30數(shù)據(jù)庫上運(yùn)行HHblits?v3.0.0以生成隱藏馬爾科夫模型的序列譜,表示為L×30大小的矩陣,L為序列長度;
SPIDER3為由SPIDER3軟件生成的結(jié)構(gòu)性特征,所述SPIDER3軟件的輸入包括蛋白質(zhì)序列以及通過PSI-BLAST和HHblits獲得的PSSM和HMM特征,所述SPIDER3軟件輸出的結(jié)構(gòu)性特征包括溶劑可及表面積、四個骨架夾角的正弦值和余弦值、半球暴露、α-螺旋結(jié)構(gòu)、β-折疊結(jié)構(gòu)和無規(guī)卷曲結(jié)構(gòu);
S3:對訓(xùn)練集進(jìn)行預(yù)處理后輸入蛋白質(zhì)功能預(yù)測系統(tǒng)模型中,對蛋白質(zhì)功能預(yù)測系統(tǒng)模型進(jìn)行訓(xùn)練;
S4:對測試集進(jìn)行預(yù)處理后輸入訓(xùn)練后的蛋白質(zhì)功能預(yù)測系統(tǒng)模型中,進(jìn)行蛋白質(zhì)功能預(yù)測。
2.根據(jù)權(quán)利要求1所述的一種結(jié)合多任務(wù)學(xué)習(xí)和自注意力機(jī)制的蛋白質(zhì)功能預(yù)測方法,其特征在于,所述步驟S1具體為:
S101:根據(jù)分子功能類別MF預(yù)測任務(wù)構(gòu)建基于自注意力機(jī)制的MF子網(wǎng)絡(luò);
S102:根據(jù)分子功能類別MF預(yù)測任務(wù)構(gòu)建基于自注意力機(jī)制的BP子網(wǎng)絡(luò);
S103:根據(jù)分子功能類別MF預(yù)測任務(wù)構(gòu)建基于自注意力機(jī)制的CC子網(wǎng)絡(luò);
S104:在MF子網(wǎng)絡(luò)、BP子網(wǎng)絡(luò)和CC子網(wǎng)絡(luò)之間設(shè)置十字繡單元,實(shí)現(xiàn)子網(wǎng)絡(luò)之間的連接和參數(shù)共享,以構(gòu)建基于多任務(wù)學(xué)習(xí)和自注意力機(jī)制的蛋白質(zhì)功能預(yù)測系統(tǒng)模型。
3.根據(jù)權(quán)利要求2所述的一種結(jié)合多任務(wù)學(xué)習(xí)和自注意力機(jī)制的蛋白質(zhì)功能預(yù)測方法,其特征在于,所述MF子網(wǎng)絡(luò)、BP子網(wǎng)絡(luò)和CC子網(wǎng)絡(luò)均包括一維卷積層、殘差卷積層、多頭自注意力層、全連接層;其中:
所述一維卷積層的輸入作為所述蛋白質(zhì)功能預(yù)測系統(tǒng)模型的輸入;
所述一維卷積層輸出端與所述殘差卷積層輸入端連接;
所述殘差卷積層輸出端與所述多頭自注意力層輸入端連接;
所述多頭自注意力層輸出端與所述全連接層輸入端連接;
所述全連接層的輸出作為所述蛋白質(zhì)功能預(yù)測系統(tǒng)模型的輸出;
所述一維卷積層與所述殘差卷積層之間、所述多頭自注意力層與所述全連接層之間均設(shè)置有十字繡單元。
4.根據(jù)權(quán)利要求3所述的一種結(jié)合多任務(wù)學(xué)習(xí)和自注意力機(jī)制的蛋白質(zhì)功能預(yù)測方法,其特征在于,所述殘差卷積層包括若干一維殘差卷積塊,其中:
每個所述一維殘差卷積塊之間均設(shè)置有十字繡單元;
首個所述一維殘差卷積塊輸入端與所述一維卷積層輸出端連接;
最后一個所述一維殘差卷積塊與所述多頭自注意力層之間設(shè)置有十字繡單元,且所述一維殘差卷積塊輸出端與所述多頭自注意力層輸入端連接。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于中山大學(xué),未經(jīng)中山大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011467595.3/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 上一篇:一種側(cè)裝電機(jī)的同步篩分機(jī)
- 下一篇:一種氣流傘
- 任務(wù)協(xié)作裝置及方法
- 用于量化任務(wù)價值的任務(wù)管理方法及裝置
- 用于運(yùn)行任務(wù)的系統(tǒng)、方法和裝置
- 一種分布式任務(wù)調(diào)度系統(tǒng)及方法
- 任務(wù)信息處理方法
- 一種同步任務(wù)異步執(zhí)行的方法和調(diào)度系統(tǒng)
- 數(shù)據(jù)處理方法、裝置、電子設(shè)備及計算機(jī)可讀介質(zhì)
- 一種自動分配和推送的任務(wù)管理平臺及方法
- 程序執(zhí)行控制的裝置及方法、終端和存儲介質(zhì)
- 基于會話的任務(wù)待辦方法、系統(tǒng)、電子設(shè)備及存儲介質(zhì)
- 根據(jù)用戶學(xué)習(xí)效果動態(tài)變化下載學(xué)習(xí)數(shù)據(jù)的系統(tǒng)及方法
- 用于智能個人化學(xué)習(xí)服務(wù)的方法
- 漸進(jìn)式學(xué)習(xí)管理方法及漸進(jìn)式學(xué)習(xí)系統(tǒng)
- 輔助學(xué)習(xí)的方法及裝置
- 基于人工智能的課程推薦方法、裝置、設(shè)備及存儲介質(zhì)
- 基于強(qiáng)化學(xué)習(xí)的自適應(yīng)移動學(xué)習(xí)路徑生成方法
- 一種線上視頻學(xué)習(xí)系統(tǒng)
- 一種基于校園大數(shù)據(jù)的自適應(yīng)學(xué)習(xí)方法、裝置及設(shè)備
- 一種學(xué)習(xí)方案推薦方法、裝置、設(shè)備和存儲介質(zhì)
- 游戲?qū)W習(xí)效果評測方法及系統(tǒng)





