[發明專利]一種蛋白質預測三維結構的質量評估方法、裝置有效
| 申請號: | 202210754951.2 | 申請日: | 2022-06-30 |
| 公開(公告)號: | CN115273968B | 公開(公告)日: | 2023-05-12 |
| 發明(設計)人: | 管佳威;張聞瀚;金慧玲;王浩博 | 申請(專利權)人: | 杭州力文所生物科技有限公司 |
| 主分類號: | G16B15/20 | 分類號: | G16B15/20;G16B5/20 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 310000 浙江省杭州市蕭山區經濟技*** | 國省代碼: | 浙江;33 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 蛋白質 預測 三維 結構 質量 評估 方法 裝置 | ||
1.一種蛋白質預測三維結構的質量評估方法,其特征在于包括以下步驟:
S1,根據基準序列預測得到若干預測結構,所述基準序列反映了已知的蛋白質氨基酸序列的真實分布,所述預測結構反映了預測的蛋白質的三維結構;
S2,將若干所述預測結構依次輸入Esm-if1模型中,得到與所述預測結構一一對應的預測序列,所述預測序列反映了預測的蛋白質氨基酸序列中各個位點氨基酸的概率分布;
S3,依次計算所述預測序列與所述基準序列的多分類交叉熵得到esmif交叉熵損失,選擇最小的esmif交叉熵損失對應的預測結構作為最優三維結構;
所述基準序列和所述預測序列均以矩陣的方式呈現,所述矩陣的第一維度表示序列位點,所述矩陣的第二維度表示氨基酸的類型,
所述預測序列與所述基準序列的多分類交叉熵的計算方法為:
其中,CCE為多分類交叉熵,N為蛋白質氨基酸序列的長度,p為基準序列中的每一個氨基酸以獨熱碼表示的概率分布,q為預測序列中的每個位點上氨基酸的概率分布,i為第一維度位點位置信息,j為第二維度氨基酸類別信息。
2.根據權利要求1所述的一種蛋白質預測三維結構的質量評估方法,其特征在于,所述預測結構通過以下步驟得到:將所述基準序列輸入蛋白質結構預測模型得到或者手動折疊氨基酸鏈得到或者在蛋白質結構預測模型輸出的預測結構的基礎上手動調整得到。
3.一種蛋白質預測三維結構的質量評估裝置,其特征在于,包括:
預測結構獲取模塊,用于根據基準序列輸出若干預測結構,所述基準序列反映了已知的蛋白質氨基酸序列的真實分布,所述預測結構反映了預測的蛋白質的三維結構;
預測序列獲取模塊,用于將若干所述預測結構依次輸入Esm-if1模型中,得到與所述預測結構一一對應的預測序列,所述預測序列反映了預測的蛋白質氨基酸序列中各個位點氨基酸的概率分布;
結構篩選模塊,用于依次計算所述預測序列與所述基準序列的多分類交叉熵得到esmif交叉熵損失,選擇最小的esmif交叉熵損失對應的預測結構作為最優三維結構;
所述基準序列和所述預測序列均以矩陣的方式呈現,所述矩陣的第一維度表示序列位點,所述矩陣的第二維度表示氨基酸的類型,
所述預測序列與所述基準序列的多分類交叉熵的計算方法為:
其中,CCE為多分類交叉熵,N為蛋白質氨基酸序列的長度,p為基準序列中的每一個氨基酸以獨熱碼表示的概率分布,q為預測序列中的每個位點上氨基酸的概率分布,i為第一維度位點位置信息,j為第二維度氨基酸類別信息。
4.一種電子設備,其特征在于,包括:
處理器以及
存儲器,所述存儲器存儲有可執行代碼,當所述可執行代碼被所述處理器執行時,使所述處理器執行如權利要求1~2任意一項所述的蛋白質預測三維結構的質量評估方法。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于杭州力文所生物科技有限公司,未經杭州力文所生物科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202210754951.2/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種光發射模塊
- 下一篇:一種將計算機斷層掃描數據傳輸至有限元模型的映射方法





