[發明專利]一種通過序列預測抗體上結合位點的深度學習方法有效
| 申請號: | 202011269669.2 | 申請日: | 2020-11-13 |
| 公開(公告)號: | CN112397139B | 公開(公告)日: | 2023-08-01 |
| 發明(設計)人: | 楊躍東;張磐 | 申請(專利權)人: | 中山大學 |
| 主分類號: | G16B15/20 | 分類號: | G16B15/20;G16B15/30;G06N3/0464;G06N3/08;G06N3/049 |
| 代理公司: | 廣州粵高專利商標代理有限公司 44102 | 代理人: | 張金福 |
| 地址: | 510260 廣東*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 通過 序列 預測 抗體 結合 深度 學習方法 | ||
1.一種通過序列預測抗體上結合位點的深度學習方法,其特征在于:所述的方法包括如下步驟:
獲取抗體上若干個高變區,將若干個高變區串連為一條高變區序列,在不同的高變區序列之間加入一種未知類型的氨基酸作為區分標識;
所述的高變區序列中每個氨基酸的特征包括詞嵌入特征、額外特征;將詞嵌入特征和額外特征合并得到最后的特征矩陣,并將特征矩陣輸入神經網絡模型;
所述的神經網絡模型采用雙向長短期記憶網絡與transformer編碼器學習高變區序列信息以及不同高變區之間的相互作用信息,預測抗體結合位點;
所述的transformer編碼器包括位置編碼、多頭注意力機制;
所述的位置編碼通過正弦和余弦函數來識別高變區序列中不同氨基酸的位置,實現預測抗體上的結合位點;
所述的多頭注意力機制通過特征矩陣獲取注意力矩陣;
所述的多頭注意力機制將特征矩陣分為多個子矩陣,形成多個子空間,實現從不同角度去關注和學習高變區之間的聯系,通過以下計算得到:
headi=Attention(QWiQ,KWiK,VWiV)
MutiHead(Q,K,V)=Concat(head1,…,headh)Wo
其中,MutiHead(Q,K,V)表示多頭注意力機制的輸出,表示注意力矩陣;Q、K、V表示高變區序列的特征矩陣、KT、dk表示特征維度;WiQ、表示W表示神經網絡中的權重矩陣;headi表示第i個頭的注意力層輸出。
2.根據權利要求1所述的通過序列預測抗體上結合位點的深度學習方法,其特征在于:將詞嵌入特征合并得到最后的特征矩陣,具體通過神經網絡模型中的Embedding層將高變區序列中的每個氨基酸轉為一個64維的特征矩陣。
3.根據權利要求2所述的通過序列預測抗體上結合位點的深度學習方法,其特征在于:所述的額外特征包括:PSSM、HHM、SPIDER3;
其中,所述的PSSM通過運行PSI-BLAST生成,每個氨基酸對應一個20維的特征矩陣;
所述的HHM通過運行HHblits生成,每個氨基酸對應一個30維的特征矩陣;
所述的SPIDER3通過蛋白質序列與得到的PSSM和HHM計算得到,每個氨基酸對應一個14維的特征矩陣。
4.根據權利要求3所述的通過序列預測抗體上結合位點的深度學習方法,其特征在于:所述的抗體是一個Y型的分子,由四條多肽鏈構成,分別為兩條相同的重鏈和輕鏈,先采用完整的重鏈和輕鏈計算出額外特征后再截取高變區。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中山大學,未經中山大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011269669.2/1.html,轉載請聲明來源鉆瓜專利網。





