[發(fā)明專利]一種蛋白質(zhì)預(yù)測三維結(jié)構(gòu)的質(zhì)量評(píng)估方法、裝置有效
| 申請?zhí)枺?/td> | 202210754951.2 | 申請日: | 2022-06-30 |
| 公開(公告)號(hào): | CN115273968B | 公開(公告)日: | 2023-05-12 |
| 發(fā)明(設(shè)計(jì))人: | 管佳威;張聞瀚;金慧玲;王浩博 | 申請(專利權(quán))人: | 杭州力文所生物科技有限公司 |
| 主分類號(hào): | G16B15/20 | 分類號(hào): | G16B15/20;G16B5/20 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 310000 浙江省杭州市蕭山區(qū)經(jīng)濟(jì)技*** | 國省代碼: | 浙江;33 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 蛋白質(zhì) 預(yù)測 三維 結(jié)構(gòu) 質(zhì)量 評(píng)估 方法 裝置 | ||
本發(fā)明公開了一種蛋白質(zhì)預(yù)測三維結(jié)構(gòu)的質(zhì)量評(píng)估方法、裝置,其技術(shù)方案要點(diǎn)是發(fā)現(xiàn)描述序列恢復(fù)程度的esmif交叉熵?fù)p失和描述與真實(shí)結(jié)構(gòu)比較的結(jié)構(gòu)質(zhì)量評(píng)估函數(shù)TMscore呈線性相關(guān),通過計(jì)算預(yù)測序列的概率與基準(zhǔn)序列的交叉熵來判斷預(yù)測的結(jié)構(gòu)質(zhì)量。具體為:將基準(zhǔn)序列輸入到各種蛋白質(zhì)結(jié)構(gòu)預(yù)測模型得到幾千或者幾萬種三維預(yù)測結(jié)構(gòu)。上述三維預(yù)測結(jié)構(gòu)也可以是手動(dòng)折疊氨基酸鏈得到,也可以是在預(yù)測模型輸出的三維預(yù)測結(jié)構(gòu)的基礎(chǔ)上手動(dòng)微調(diào)得到。然后根據(jù)上述若干三維預(yù)測結(jié)構(gòu)反推回序列,根據(jù)反推回的序列與基準(zhǔn)序列的差距對三維預(yù)測結(jié)構(gòu)的準(zhǔn)確性進(jìn)行判斷,從而得到最接近真實(shí)蛋白質(zhì)的三維結(jié)構(gòu)。
技術(shù)領(lǐng)域
本發(fā)明涉及蛋白質(zhì)三維結(jié)構(gòu)預(yù)測領(lǐng)域,更具體的說是涉及一種蛋白質(zhì)預(yù)測三維結(jié)構(gòu)的質(zhì)量評(píng)估方法、裝置。
背景技術(shù)
蛋白質(zhì)是自然界中非常重要的生物分子。基于氨基酸序列直接預(yù)測蛋白質(zhì)的三維結(jié)構(gòu)是一個(gè)具有挑戰(zhàn)性的問題,對現(xiàn)代生物學(xué)和醫(yī)學(xué)產(chǎn)生了重大影響。是否能準(zhǔn)確地預(yù)測蛋白質(zhì)三維結(jié)構(gòu)對于蛋白質(zhì)功能的理解、設(shè)計(jì)具有新生物學(xué)功能的蛋白質(zhì)以及研發(fā)新藥等方面均發(fā)揮著關(guān)鍵作用。隨著人類基因組計(jì)劃的完成,大量的蛋白質(zhì)氨基酸序列已經(jīng)通過基因組測序技術(shù)獲悉,目前測序分析得到的新的氨基酸序列的數(shù)量仍舊以爆炸式的速度增加,而實(shí)驗(yàn)確定的三維結(jié)構(gòu)數(shù)量的增長速度卻遠(yuǎn)遠(yuǎn)落后于序列分析。目前主要的實(shí)驗(yàn)方法有?X?射線晶體學(xué)、核磁共振(NMR)和?冷凍電鏡(Cryo-EM)。這些現(xiàn)有的方法往往需要大量的時(shí)間和昂貴的資源。
結(jié)構(gòu)預(yù)測的一個(gè)主要挑戰(zhàn)是從生成的三維結(jié)構(gòu)池中選擇最佳三維結(jié)構(gòu)。蛋白質(zhì)結(jié)構(gòu)預(yù)測模型,例如Rosetta、RosettaFold、AlphaFold2可以根據(jù)一條氨基酸序列預(yù)測出大量的蛋白質(zhì)三維結(jié)構(gòu),但很難預(yù)測哪個(gè)結(jié)構(gòu)最接近原生結(jié)構(gòu)。因此,我們希望探索一種只需要輸入氨基酸序列即可獲得準(zhǔn)確度高的預(yù)測蛋白質(zhì)三維結(jié)構(gòu)的方法。
發(fā)明內(nèi)容
針對現(xiàn)有技術(shù)存在的不足,本發(fā)明的目的之一在于提供一種不需要MSA即可得到準(zhǔn)確性高的蛋白質(zhì)三維結(jié)構(gòu)的蛋白質(zhì)預(yù)測三維結(jié)構(gòu)的質(zhì)量評(píng)估方法。
為實(shí)現(xiàn)上述目的,本發(fā)明提供了如下技術(shù)方案:
一種蛋白質(zhì)預(yù)測三維結(jié)構(gòu)的質(zhì)量評(píng)估方法:
S1,根據(jù)基準(zhǔn)序列預(yù)測得到若干預(yù)測結(jié)構(gòu),所述基準(zhǔn)序列反映了已知的蛋白質(zhì)氨基酸序列的真實(shí)分布,所述預(yù)測結(jié)構(gòu)反映了預(yù)測的蛋白質(zhì)的三維結(jié)構(gòu)。該預(yù)測結(jié)構(gòu)可以包括與蛋白質(zhì)的真實(shí)結(jié)構(gòu)相差較多的三維結(jié)構(gòu),本發(fā)明對初始輸入的預(yù)測結(jié)構(gòu)的質(zhì)量要求較低;
S2,將若干所述預(yù)測結(jié)構(gòu)依次輸入Esm-if1模型中,得到與所述預(yù)測結(jié)構(gòu)一一對應(yīng)的預(yù)測序列,所述預(yù)測序列反映了預(yù)測的蛋白質(zhì)氨基酸序列中各個(gè)位點(diǎn)氨基酸的概率分布;
S3,依次計(jì)算所述預(yù)測序列與所述基準(zhǔn)序列的多分類交叉熵(CCE)得到esmif交叉熵?fù)p失,選擇最小的esmif交叉熵?fù)p失對應(yīng)的預(yù)測結(jié)構(gòu)作為最優(yōu)三維結(jié)構(gòu)。
作為優(yōu)選,所述基準(zhǔn)序列和所述預(yù)測序列均以矩陣的方式呈現(xiàn),所述矩陣的第一維度表示序列位點(diǎn)位置信息,所述矩陣的第二維度表示氨基酸類別信息,
所述預(yù)測序列與所述基準(zhǔn)序列的多分類交叉熵的計(jì)算方法為:
其中,CCE為多分類交叉熵,N為蛋白質(zhì)氨基酸序列的長度,p為基準(zhǔn)序列中的每一個(gè)氨基酸以獨(dú)熱碼表示的概率分布,q為預(yù)測序列中的每個(gè)位點(diǎn)上氨基酸的概率分布,i為第一維度位點(diǎn)位置信息,j為第二維度氨基酸類別信息。獨(dú)熱碼是一種二進(jìn)制編碼方式,它的特點(diǎn)是,用來編碼這個(gè)數(shù)的N位bit中,有且只有一位是1,其余位全部為0。
作為優(yōu)選,所述預(yù)測結(jié)構(gòu)通過以下步驟得到:將所述基準(zhǔn)序列輸入蛋白質(zhì)結(jié)構(gòu)預(yù)測模型得到或者手動(dòng)折疊氨基酸鏈得到或者在蛋白質(zhì)結(jié)構(gòu)預(yù)測模型輸出的預(yù)測結(jié)構(gòu)的基礎(chǔ)上手動(dòng)調(diào)整得到。
針對現(xiàn)有技術(shù)存在的不足,本發(fā)明的目的之二在于提供一種蛋白質(zhì)預(yù)測三維結(jié)構(gòu)的質(zhì)量評(píng)估裝置,包括:
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于杭州力文所生物科技有限公司,未經(jīng)杭州力文所生物科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202210754951.2/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 圖像編碼裝置、圖像編碼方法、圖像譯碼裝置、圖像譯碼方法、程序以及記錄介質(zhì)
- 圖像編碼裝置、圖像編碼方法、圖像譯碼裝置、圖像譯碼方法
- 圖像編碼裝置、圖像編碼方法、圖像譯碼裝置、圖像譯碼方法
- 基于時(shí)間序列預(yù)測模型適用性量化的預(yù)測模型選擇方法
- 圖像編碼裝置、圖像編碼方法、圖像譯碼裝置、圖像譯碼方法
- 分類預(yù)測方法及裝置、預(yù)測模型訓(xùn)練方法及裝置
- 幀內(nèi)預(yù)測的方法及裝置
- 圖像預(yù)測方法及裝置、電子設(shè)備和存儲(chǔ)介質(zhì)
- 文本預(yù)測方法、裝置以及電子設(shè)備
- 模型融合方法、預(yù)測方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 一種三維彩色物品制作方法
- 三維內(nèi)容顯示的方法、裝置和系統(tǒng)
- 三維對象搜索方法、裝置及系統(tǒng)
- 三維會(huì)話數(shù)據(jù)展示方法、裝置、存儲(chǔ)介質(zhì)和計(jì)算機(jī)設(shè)備
- 一種三維模型處理方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)
- 用于基于分布式賬本技術(shù)的三維打印的去中心化供應(yīng)鏈
- 標(biāo)記數(shù)據(jù)的獲取方法及裝置、訓(xùn)練方法及裝置、醫(yī)療設(shè)備
- 一種基于5G網(wǎng)絡(luò)的光場三維浸入式體驗(yàn)信息傳輸方法及系統(tǒng)
- 用于機(jī)器人生產(chǎn)系統(tǒng)仿真的三維場景管理與文件存儲(chǔ)方法
- 基于三維形狀知識(shí)圖譜的三維模型檢索方法及裝置
- 卡片結(jié)構(gòu)、插座結(jié)構(gòu)及其組合結(jié)構(gòu)
- 鋼結(jié)構(gòu)平臺(tái)結(jié)構(gòu)
- 鋼結(jié)構(gòu)支撐結(jié)構(gòu)
- 鋼結(jié)構(gòu)支撐結(jié)構(gòu)
- 單元結(jié)構(gòu)、結(jié)構(gòu)部件和夾層結(jié)構(gòu)
- 鋼結(jié)構(gòu)扶梯結(jié)構(gòu)
- 鋼結(jié)構(gòu)隔墻結(jié)構(gòu)
- 鋼結(jié)構(gòu)連接結(jié)構(gòu)
- 螺紋結(jié)構(gòu)、螺孔結(jié)構(gòu)、機(jī)械結(jié)構(gòu)和光學(xué)結(jié)構(gòu)
- 螺紋結(jié)構(gòu)、螺孔結(jié)構(gòu)、機(jī)械結(jié)構(gòu)和光學(xué)結(jié)構(gòu)





