[發(fā)明專利]基于注意力機(jī)制的抗體非定序預(yù)測(cè)方法和裝置有效
| 申請(qǐng)?zhí)枺?/td> | 202210466987.0 | 申請(qǐng)日: | 2022-04-29 |
| 公開(公告)號(hào): | CN114822696B | 公開(公告)日: | 2023-04-18 |
| 發(fā)明(設(shè)計(jì))人: | 張林峰;孫偉杰;溫翰;許瑞晗 | 申請(qǐng)(專利權(quán))人: | 北京深勢(shì)科技有限公司 |
| 主分類號(hào): | G16B30/00 | 分類號(hào): | G16B30/00;G16B40/00;G06N3/04 |
| 代理公司: | 北京漢智嘉成知識(shí)產(chǎn)權(quán)代理有限公司 11682 | 代理人: | 金潔;谷惠敏 |
| 地址: | 100080 北京*** | 國(guó)省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說(shuō)明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 基于 注意力 機(jī)制 抗體 非定序 預(yù)測(cè) 方法 裝置 | ||
1.一種基于注意力機(jī)制的抗體非定序預(yù)測(cè)方法,其特征在于,應(yīng)用于實(shí)現(xiàn)抗體溶解度和聚集度的預(yù)測(cè)和改造、抗體人源化預(yù)測(cè)和改造、抗體表達(dá)量預(yù)測(cè)和改造、抗體抗原對(duì)接和抗原表面位預(yù)測(cè)、造抗體改造展示庫(kù)構(gòu)建或者抗體從頭設(shè)計(jì),該方法包括:
獲取抗體數(shù)據(jù)庫(kù),其中所述抗體數(shù)據(jù)庫(kù)為針對(duì)特定問題的抗體序列數(shù)據(jù)集合,所述針對(duì)特定問題的抗體序列數(shù)據(jù)集合為cab-rep人源數(shù)據(jù)庫(kù)、OAS人源數(shù)據(jù)庫(kù)或者INDI納米抗體序列庫(kù)中的一者或者多者的組合;
將所述抗體數(shù)據(jù)庫(kù)輸入非定序神經(jīng)網(wǎng)絡(luò)模型進(jìn)行訓(xùn)練,直至誤差低于閾值或趨于穩(wěn)定時(shí)停止訓(xùn)練,得到訓(xùn)練好的抗體非定序預(yù)測(cè)模型,本步驟具體包括:獲取相關(guān)抗體的蛋白質(zhì)數(shù)據(jù)或者相關(guān)抗體的同源蛋白質(zhì)的數(shù)據(jù)中的至少之一,把數(shù)據(jù)輸入神經(jīng)網(wǎng)絡(luò),經(jīng)由神經(jīng)網(wǎng)絡(luò)得到相關(guān)抗體的全部氨基酸序列和相關(guān)抗體的同源蛋白質(zhì)的全部氨基酸序列的預(yù)測(cè)值,根據(jù)相關(guān)抗體全部氨基酸序列和相關(guān)抗體的同源蛋白質(zhì)的全部氨基酸序列的預(yù)測(cè)值,以及相關(guān)抗體的全部氨基酸序列和相關(guān)抗體的同源蛋白質(zhì)的全部氨基酸序列的真值,訓(xùn)練神經(jīng)網(wǎng)絡(luò),其中所述非定序神經(jīng)網(wǎng)絡(luò)模型為廣義自回歸預(yù)訓(xùn)練注意力模型或者雙向生成式預(yù)訓(xùn)練注意力模型,所述非定序神經(jīng)網(wǎng)絡(luò)模型具體包括編碼模型和解碼模型:編碼模型和解碼模型分別包括至少一個(gè)注意力模塊;
將待預(yù)測(cè)抗體信息輸入所述抗體非定序預(yù)測(cè)模型,得到所述待預(yù)測(cè)抗體的全部氨基酸序列的預(yù)測(cè)值或概率分布,本步驟具體包括:通過(guò)采用編碼模型獲CDR-H1和CDR-H2的信息,通過(guò)采用解碼模型,預(yù)測(cè)CDR-H3的信息;進(jìn)一步考慮非互補(bǔ)決定區(qū)的骨架序列,通過(guò)編碼模型獲取整個(gè)骨架區(qū)序列信息并采用解碼模型預(yù)測(cè)CDR-H3信息:將待預(yù)測(cè)抗體和待預(yù)測(cè)抗體的同源蛋白質(zhì)的數(shù)據(jù)中的至少之一輸入編碼模型中的非定序自注意力模塊,經(jīng)由非定序自注意力模塊得到待預(yù)測(cè)抗體對(duì)應(yīng)的中間結(jié)果,然后將待預(yù)測(cè)抗體和待預(yù)測(cè)抗體的同源蛋白質(zhì)的數(shù)據(jù)中的至少之一以及中間結(jié)果輸入編碼模型中的非定序自注意力模塊,經(jīng)由非定序自注意力模塊得到待預(yù)測(cè)抗體對(duì)應(yīng)的全部氨基酸序列的預(yù)測(cè)值,將待預(yù)測(cè)抗體的部分區(qū)域的序列信息輸入非定序自注意力模塊,獲得該抗體未預(yù)測(cè)區(qū)域中的一個(gè)隨機(jī)位置的預(yù)測(cè)值,并將該預(yù)測(cè)值和上一輪輸入的部分區(qū)域的序列信息合并作為新一輪的輸入,輸入非定序自注意力模塊,重復(fù)以上過(guò)程直至獲得待預(yù)測(cè)抗體的全部區(qū)域的預(yù)測(cè)值,其中,待預(yù)測(cè)抗體信息包括如下內(nèi)容之一者或多者組合:待預(yù)測(cè)抗體的部分位點(diǎn)的氨基酸序列、待預(yù)測(cè)抗體的氨基酸序列長(zhǎng)度、待預(yù)測(cè)抗體的多個(gè)同源蛋白質(zhì)的氨基酸序列中氨基酸分布的概率信息。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述注意力模塊的輸入由隨機(jī)設(shè)定預(yù)測(cè)順序的標(biāo)簽數(shù)據(jù)確定,所述注意力模塊的輸出由全部標(biāo)簽數(shù)據(jù)確定,其中,標(biāo)簽數(shù)據(jù)是指整個(gè)抗體序列包含骨架區(qū)域與互補(bǔ)決定區(qū)或者單純互補(bǔ)決定區(qū)序列。
3.根據(jù)權(quán)利要求2所述的方法,其特征在于,所述隨機(jī)設(shè)定預(yù)測(cè)順序的標(biāo)簽數(shù)據(jù)使用掩膜方法屏蔽部分序列的信息,以預(yù)測(cè)被屏蔽部分的序列信息。
4.一種基于注意力機(jī)制的抗體非定序預(yù)測(cè)裝置,其特征在于,用于實(shí)現(xiàn)抗體溶解度和聚集度的預(yù)測(cè)和改造、抗體人源化預(yù)測(cè)和改造、抗體表達(dá)量預(yù)測(cè)和改造、抗體抗原對(duì)接和抗原表面位預(yù)測(cè)、造抗體改造展示庫(kù)構(gòu)建或者抗體從頭設(shè)計(jì),該裝置包括:
獲取模塊,用于獲取抗體數(shù)據(jù)庫(kù),所述抗體數(shù)據(jù)庫(kù)為針對(duì)特定問題的抗體序列數(shù)據(jù)集合,所述針對(duì)特定問題的抗體序列數(shù)據(jù)集合為cab-rep人源數(shù)據(jù)庫(kù)、OAS人源數(shù)據(jù)庫(kù)或者INDI納米抗體序列庫(kù)中的一者或者多者的組合;
模型訓(xùn)練模塊,用于將所述抗體數(shù)據(jù)庫(kù)輸入非定序神經(jīng)網(wǎng)絡(luò)模型進(jìn)行訓(xùn)練,直至誤差低于閾值或趨于穩(wěn)定時(shí)停止訓(xùn)練,得到訓(xùn)練好的抗體非定序預(yù)測(cè)模型,還用于:獲取相關(guān)抗體的蛋白質(zhì)數(shù)據(jù)或者相關(guān)抗體的同源蛋白質(zhì)的數(shù)據(jù)中的至少之一,把數(shù)據(jù)輸入神經(jīng)網(wǎng)絡(luò),經(jīng)由神經(jīng)網(wǎng)絡(luò)得到相關(guān)抗體的全部氨基酸序列和相關(guān)抗體的同源蛋白質(zhì)的全部氨基酸序列的預(yù)測(cè)值,根據(jù)相關(guān)抗體全部氨基酸序列和相關(guān)抗體的同源蛋白質(zhì)的全部氨基酸序列的預(yù)測(cè)值,以及相關(guān)抗體的全部氨基酸序列和相關(guān)抗體的同源蛋白質(zhì)的全部氨基酸序列的真值,訓(xùn)練神經(jīng)網(wǎng)絡(luò),其中所述非定序神經(jīng)網(wǎng)絡(luò)模型為廣義自回歸預(yù)訓(xùn)練注意力模型或者雙向生成式預(yù)訓(xùn)練注意力模型,所述非定序神經(jīng)網(wǎng)絡(luò)模型具體包括編碼模型和解碼模型:編碼模型和解碼模型分別包括至少一個(gè)注意力模塊;
應(yīng)用模塊,用于將待預(yù)測(cè)抗體局部信息輸入所述抗體非定序預(yù)測(cè)模型,得到所述待預(yù)測(cè)抗體的全部氨基酸序列的預(yù)測(cè)值或概率分布,還用于:通過(guò)采用編碼模型獲CDR-H1和CDR-H2的信息,通過(guò)采用解碼模型,預(yù)測(cè)CDR-H3的信息;進(jìn)一步考慮非互補(bǔ)決定區(qū)的骨架序列,通過(guò)編碼模型獲取整個(gè)骨架區(qū)序列信息并采用解碼模型預(yù)測(cè)CDR-H3信息:將待預(yù)測(cè)抗體和待預(yù)測(cè)抗體的同源蛋白質(zhì)的數(shù)據(jù)中的至少之一輸入編碼模型中的非定序自注意力模塊,經(jīng)由非定序自注意力模塊得到待預(yù)測(cè)抗體對(duì)應(yīng)的中間結(jié)果,然后將待預(yù)測(cè)抗體和待預(yù)測(cè)抗體的同源蛋白質(zhì)的數(shù)據(jù)中的至少之一以及中間結(jié)果輸入編碼模型中的非定序自注意力模塊,經(jīng)由非定序自注意力模塊得到待預(yù)測(cè)抗體對(duì)應(yīng)的全部氨基酸序列的預(yù)測(cè)值,將待預(yù)測(cè)抗體的部分區(qū)域的序列信息輸入非定序自注意力模塊,獲得該抗體未預(yù)測(cè)區(qū)域中的一個(gè)隨機(jī)位置的預(yù)測(cè)值,并將該預(yù)測(cè)值和上一輪輸入的部分區(qū)域的序列信息合并作為新一輪的輸入,輸入非定序自注意力模塊,重復(fù)以上過(guò)程直至獲得待預(yù)測(cè)抗體的全部區(qū)域的預(yù)測(cè)值,其中,待預(yù)測(cè)抗體信息包括如下內(nèi)容之一者或多者組合:待預(yù)測(cè)抗體的部分位點(diǎn)的氨基酸序列、待預(yù)測(cè)抗體的氨基酸序列長(zhǎng)度、待預(yù)測(cè)抗體的多個(gè)同源蛋白質(zhì)的氨基酸序列中氨基酸分布的概率信息。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于北京深勢(shì)科技有限公司,未經(jīng)北京深勢(shì)科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202210466987.0/1.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 基于粒子濾波視覺注意力模型的運(yùn)動(dòng)目標(biāo)檢測(cè)方法
- 一種評(píng)測(cè)注意力狀態(tài)的方法及裝置
- 注意力測(cè)評(píng)方法、系統(tǒng)及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)
- 兒童注意力評(píng)估系統(tǒng)及其方法
- 一種注意力檢測(cè)方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 一種注意力識(shí)別方法和裝置
- 一種可靠的用戶注意力監(jiān)測(cè)估計(jì)表示模型
- 注意力特征圖獲取方法及裝置、目標(biāo)檢測(cè)的方法及裝置
- 基于通道增強(qiáng)的雙注意力生成對(duì)抗網(wǎng)絡(luò)及圖像生成方法
- 一種文本情感分析模型的優(yōu)化方法及裝置
- 一種機(jī)制蛋的制造方法
- 手機(jī)制式的校準(zhǔn)方法、系統(tǒng)及手機(jī)檢測(cè)設(shè)備
- 一種考慮激勵(lì)機(jī)制電量電價(jià)彈性矩陣的耗電量估測(cè)方法
- 選擇區(qū)塊鏈共識(shí)機(jī)制的方法、裝置以及共識(shí)節(jié)點(diǎn)
- 一種復(fù)合改性機(jī)制砂及其制備方法
- 一種存儲(chǔ)設(shè)備糾錯(cuò)方法及糾錯(cuò)裝置
- 區(qū)塊鏈中共識(shí)機(jī)制的處理方法、裝置和電子設(shè)備
- 一種建筑用機(jī)制砂整形裝置
- 通信方法、通信裝置及存儲(chǔ)介質(zhì)
- 一種網(wǎng)絡(luò)預(yù)約出租車市場(chǎng)準(zhǔn)入機(jī)制的優(yōu)化方法及系統(tǒng)
- 識(shí)別結(jié)合了抗原的抗體與沒有結(jié)合抗原的抗體的結(jié)構(gòu)變化的抗體及其獲得方法
- 一種治療類風(fēng)濕性關(guān)節(jié)炎的醫(yī)藥組成物
- 抗CD3抗體、可活化抗CD3抗體、多特異性抗CD3抗體、多特異性可活化抗CD3抗體及其使用方法
- 十色抗體組合物及其在白血病淋巴瘤分型中的應(yīng)用
- 用于鑒定造血細(xì)胞亞型的用途、方法、試劑盒、組合物和抗體
- 基于小世界網(wǎng)絡(luò)搜索的孔群加工路徑優(yōu)化方法
- 一種快速診斷家族性噬血細(xì)胞綜合征3型的試劑盒及其應(yīng)用
- 腫瘤患者免疫細(xì)胞功能評(píng)估試劑盒及評(píng)估方法
- 自身抗體的定量方法
- 抗體組合物及其篩查髓系疾病及檢測(cè)免疫檢查點(diǎn)的應(yīng)用





