[發(fā)明專(zhuān)利]一種通過(guò)序列預(yù)測(cè)抗體上結(jié)合位點(diǎn)的深度學(xué)習(xí)方法有效
| 申請(qǐng)?zhí)枺?/td> | 202011269669.2 | 申請(qǐng)日: | 2020-11-13 |
| 公開(kāi)(公告)號(hào): | CN112397139B | 公開(kāi)(公告)日: | 2023-08-01 |
| 發(fā)明(設(shè)計(jì))人: | 楊躍東;張磐 | 申請(qǐng)(專(zhuān)利權(quán))人: | 中山大學(xué) |
| 主分類(lèi)號(hào): | G16B15/20 | 分類(lèi)號(hào): | G16B15/20;G16B15/30;G06N3/0464;G06N3/08;G06N3/049 |
| 代理公司: | 廣州粵高專(zhuān)利商標(biāo)代理有限公司 44102 | 代理人: | 張金福 |
| 地址: | 510260 廣東*** | 國(guó)省代碼: | 廣東;44 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 通過(guò) 序列 預(yù)測(cè) 抗體 結(jié)合 深度 學(xué)習(xí)方法 | ||
本發(fā)明涉及抗體結(jié)合位點(diǎn)預(yù)測(cè)領(lǐng)域,具體提供一種通過(guò)序列預(yù)測(cè)抗體上結(jié)合位點(diǎn)的深度學(xué)習(xí)方法,包括如下步驟:獲取抗體上若干個(gè)高變區(qū),將若干個(gè)高變區(qū)串連為一條高變區(qū)序列,在不同的高變區(qū)序列之間加入一種未知類(lèi)型的氨基酸作為區(qū)分標(biāo)識(shí);所述的高變區(qū)序列中每個(gè)氨基酸的特征包括詞嵌入特征、額外特征;將詞嵌入特征和額外特征合并得到最后的特征矩陣,并將特征矩陣輸入神經(jīng)網(wǎng)絡(luò)模型;所述的神經(jīng)網(wǎng)絡(luò)模型采用雙向長(zhǎng)短期記憶網(wǎng)絡(luò)與transformer編碼器學(xué)習(xí)高變區(qū)序列信息以及不同高變區(qū)之間的相互作用信息,預(yù)測(cè)抗體結(jié)合位點(diǎn)。本發(fā)明能通過(guò)學(xué)習(xí)不同高變區(qū)之間的相互作用信息,準(zhǔn)確地預(yù)測(cè)抗體結(jié)合位點(diǎn)。
技術(shù)領(lǐng)域
本發(fā)明涉及抗體結(jié)合位點(diǎn)預(yù)測(cè)技術(shù)領(lǐng)域,更具體地,涉及一種通過(guò)序列預(yù)測(cè)抗體上結(jié)合位點(diǎn)的深度學(xué)習(xí)方法。
背景技術(shù)
抗體是一種蛋白質(zhì),在免疫系統(tǒng)中起著至關(guān)重要的作用,抗體的結(jié)構(gòu)與抗體抗原結(jié)合過(guò)程如圖1所示。抗體結(jié)合位點(diǎn)預(yù)測(cè)的主要目標(biāo)是準(zhǔn)確地預(yù)測(cè)免疫過(guò)程中負(fù)責(zé)與抗原結(jié)合的抗體高變區(qū)上哪些氨基酸會(huì)與抗原接觸,探究抗體的結(jié)合模式,有助于免疫機(jī)理研究、疾病診斷和抗體設(shè)計(jì)。
抗體結(jié)合位點(diǎn)預(yù)測(cè)的相關(guān)研究方法主要分為傳統(tǒng)方法與機(jī)器學(xué)習(xí)方法兩種,接下來(lái)分別進(jìn)行介紹。
在2002年被[Duhovny?et?al.2002]提出一種基于蛋白質(zhì)形狀互補(bǔ)來(lái)預(yù)測(cè)抗體結(jié)合位點(diǎn)的方法[Efficient?Unbound?Docking?of?Rigid?Molecules,IRSP-SAIC,Lab.ofExperimental?and?Computational?Biology,NCI-FCRDC,Bldg?469,Rm?151,Frederick,MD21702,USA],方法主要分為三步:(1)分子形狀表征。計(jì)算分子表面,應(yīng)用分割算法檢測(cè)幾何區(qū)域(凹面,凸面,平坦面),對(duì)這些區(qū)域進(jìn)行過(guò)濾只留下熱點(diǎn)殘基。(2)表面區(qū)域匹配。結(jié)合幾何散列和姿勢(shì)聚類(lèi)匹配技術(shù)來(lái)匹配第一步檢測(cè)到的區(qū)域,凹面區(qū)域可以與任何類(lèi)型的凸面和平坦區(qū)域相匹配。(3)過(guò)濾和評(píng)分。檢查第二步得到的候選復(fù)合物,丟棄所有受體原子不能滲透配體原子的復(fù)合物,最后根據(jù)幾何形狀的互補(bǔ)性得分對(duì)候選復(fù)合物進(jìn)行排序。然而該方法不僅步驟繁瑣,而且需要受體蛋白和配體蛋白的完整結(jié)構(gòu)文件。眾所周知,得到一個(gè)蛋白質(zhì)完整的結(jié)構(gòu)是一項(xiàng)非常耗時(shí)耗財(cái)?shù)墓ぷ鳎酥猓诳贵w發(fā)現(xiàn)的早期階段,通常只有蛋白質(zhì)序列信息是可用的,因此該方法具有很大的局限性,實(shí)用價(jià)值不高。
近年來(lái),隨著人工智能技術(shù)的發(fā)展,機(jī)器學(xué)習(xí)和深度學(xué)習(xí)方法在蛋白質(zhì)序列問(wèn)題上展現(xiàn)了巨大的學(xué)習(xí)能力。
[Olimpieri?et?al.2013]首先提出了一種基于隨機(jī)森林的方法proABC替代傳統(tǒng)方法[Prediction?of?site-specific?interactions?in?antibody-antigen?complexes:the?proABC?method?and?server,Bioinformatics],也是最早將機(jī)器學(xué)習(xí)方法應(yīng)用在抗體結(jié)合位點(diǎn)預(yù)測(cè)問(wèn)題上的研究之一。但由于機(jī)器學(xué)習(xí)模型在序列問(wèn)題上的擬合能力不足,模型效果還有很大的提升空間。[Liberis?et?al.2018]提出了一種稱(chēng)為Parapred的神經(jīng)網(wǎng)絡(luò)架構(gòu)[Liberis?et?al.2018,Parapred:antibody?paratope?prediction?usingconvolutional?and?recurrent?neural?networks.Bioinformatics(Oxford,England)],主要基于卷積神經(jīng)網(wǎng)絡(luò)與循環(huán)神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn),與以往的方法相比,該架構(gòu)只需要抗體的序列信息就可以預(yù)測(cè)抗體結(jié)合位點(diǎn),通過(guò)神經(jīng)網(wǎng)絡(luò)強(qiáng)大的擬合能力學(xué)習(xí)抗體序列的前后信息,在抗體結(jié)合位點(diǎn)預(yù)測(cè)問(wèn)題上表現(xiàn)出了優(yōu)越的性能。但該方法將所有抗體高變區(qū)當(dāng)做獨(dú)立的樣本來(lái)處理,這種做法忽略了同一個(gè)抗體上不同高變區(qū)之間的相互聯(lián)系與作用,使得網(wǎng)絡(luò)只能學(xué)習(xí)到單個(gè)高變區(qū)的序列信息。
綜上所述,想要準(zhǔn)確地預(yù)測(cè)抗體結(jié)合位點(diǎn),不僅要學(xué)習(xí)單個(gè)高變區(qū)的序列信息,同時(shí)還要考慮在抗體抗原結(jié)合過(guò)程中不同高變區(qū)之間的相互作用信息,現(xiàn)有的方法無(wú)法學(xué)習(xí)這方面的信息,不僅如此,現(xiàn)有的網(wǎng)絡(luò)結(jié)構(gòu)在解決序列長(zhǎng)依賴(lài)問(wèn)題時(shí)表現(xiàn)欠佳。
該專(zhuān)利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專(zhuān)利權(quán)人授權(quán)。該專(zhuān)利全部權(quán)利屬于中山大學(xué),未經(jīng)中山大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買(mǎi)此專(zhuān)利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011269669.2/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專(zhuān)利網(wǎng)。
- 圖像編碼裝置、圖像編碼方法、圖像譯碼裝置、圖像譯碼方法、程序以及記錄介質(zhì)
- 圖像編碼裝置、圖像編碼方法、圖像譯碼裝置、圖像譯碼方法
- 圖像編碼裝置、圖像編碼方法、圖像譯碼裝置、圖像譯碼方法
- 基于時(shí)間序列預(yù)測(cè)模型適用性量化的預(yù)測(cè)模型選擇方法
- 圖像編碼裝置、圖像編碼方法、圖像譯碼裝置、圖像譯碼方法
- 分類(lèi)預(yù)測(cè)方法及裝置、預(yù)測(cè)模型訓(xùn)練方法及裝置
- 幀內(nèi)預(yù)測(cè)的方法及裝置
- 圖像預(yù)測(cè)方法及裝置、電子設(shè)備和存儲(chǔ)介質(zhì)
- 文本預(yù)測(cè)方法、裝置以及電子設(shè)備
- 模型融合方法、預(yù)測(cè)方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 識(shí)別結(jié)合了抗原的抗體與沒(méi)有結(jié)合抗原的抗體的結(jié)構(gòu)變化的抗體及其獲得方法
- 一種治療類(lèi)風(fēng)濕性關(guān)節(jié)炎的醫(yī)藥組成物
- 抗CD3抗體、可活化抗CD3抗體、多特異性抗CD3抗體、多特異性可活化抗CD3抗體及其使用方法
- 十色抗體組合物及其在白血病淋巴瘤分型中的應(yīng)用
- 用于鑒定造血細(xì)胞亞型的用途、方法、試劑盒、組合物和抗體
- 基于小世界網(wǎng)絡(luò)搜索的孔群加工路徑優(yōu)化方法
- 一種快速診斷家族性噬血細(xì)胞綜合征3型的試劑盒及其應(yīng)用
- 腫瘤患者免疫細(xì)胞功能評(píng)估試劑盒及評(píng)估方法
- 自身抗體的定量方法
- 抗體組合物及其篩查髓系疾病及檢測(cè)免疫檢查點(diǎn)的應(yīng)用





