[發明專利]一種蛋白質冷凍電鏡結構解析模型訓練方法和解析方法有效
| 申請號: | 202010018788.4 | 申請日: | 2020-01-08 |
| 公開(公告)號: | CN111210869B | 公開(公告)日: | 2023-06-20 |
| 發明(設計)人: | 楊躍東;陳晟;李雄俊;盧宇彤 | 申請(專利權)人: | 中山大學 |
| 主分類號: | G16B15/00 | 分類號: | G16B15/00;G16B20/00;G06N3/0464;G06N3/08 |
| 代理公司: | 廣州潤禾知識產權代理事務所(普通合伙) 44446 | 代理人: | 歐秋望 |
| 地址: | 510275 廣東*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 蛋白質 冷凍 結構 解析 模型 訓練 方法 | ||
1.一種蛋白質冷凍電鏡結構解析方法,其特征在于,采用Cα位點預測模型、二級結構預測模型和氨基酸類型預測模型,包括:
獲取待預測蛋白質電子云密度圖像;
以所述待預測蛋白質電子云密度圖像中像素密度高于預設密度值的像素點為中心,按預設大小框選出待測子圖像;
將所述待測子圖像輸入所述Cα位點預測模型,預測得到Cα位點,所述Cα位點為蛋白質中氨基酸Cα原子在所述蛋白質電子云密度圖像的位點;
將其中心為Cα位點的所述待測子圖像分別輸入所述二級結構預測模型和所述氨基酸類型預測模型,預測得到每個所述Cα位點的二級結構和每個所述Cα位點的氨基酸類型;
根據所述Cα位點、每個所述Cα位點的二級結構和每個所述Cα位點的氨基酸類型,建立蛋白質主鏈模型;
根據所述Cα位點、每個所述Cα位點的二級結構和每個所述Cα位點的氨基酸類型,建立蛋白質主鏈模型,包括:
根據已知的氨基酸序列,結合所述Cα位點、每個所述Cα位點的二級結構和每個所述Cα位點的氨基酸類型,確定部分序列位點;
以確定的所述序列位點為分段點,將氨基酸序列分為多段,進行分段樹搜索,根據每段搜索的結果組成Cα模型池,采用折疊識別打分方式對Cα模型池進行打分篩選,得到蛋白質主鏈模型;
根據已知的氨基酸序列,結合所述Cα位點、每個所述Cα位點的二級結構和每個所述Cα位點的氨基酸類型,確定部分序列位點,包括:
根據已知的氨基酸序列得到每個序列位點的二級結構信息,將已知的氨基酸序列和所得到每個序列位點的二級結構信息與預測得到的每個所述Cα位點的氨基酸類型和每個所述Cα位點的二級結構進行匹配打分,將氨基酸類型的匹配打分與二級結構的匹配打分相乘,得到初始的打分矩陣,所述打分矩陣的行表示已知的氨基酸序列位點、列表示預測的Cα位點;
根據相鄰Cα位點在空間結構上的距離約束,更新所述打分矩陣;
將更新后的所述打分矩陣中打分相對于其它元素較大的若干元素所對應的Cα位點作為序列位點。
2.根據權利要求1所述的蛋白質冷凍電鏡結構解析方法,其特征在于,將所述待測子圖像輸入所述Cα位點預測模型,預測得到Cα位點之后,還包括:
采用非極大值抑制算法對所述Cα位點進行篩選;
將其中心為Cα位點的所述待測子圖像分別輸入所述二級結構預測模型和所述氨基酸類型預測模型,預測得到對應所述Cα位點的二級結構和對應所述Cα位點的氨基酸類型,具體為:
將其中心為篩選后Cα位點的所述待測子圖像分別輸入所述二級結構預測模型和所述氨基酸類型預測模型,預測得到對應所述Cα位點的二級結構和對應所述Cα位點的氨基酸類型;
根據所述Cα位點、每個所述Cα位點的二級結構和每個所述Cα位點的氨基酸類型,建立蛋白質主鏈模型,具體為:
根據篩選后的Cα位點、每個篩選后Cα位點的二級結構和每個篩選后Cα位點的氨基酸類型,建立蛋白質主鏈模型。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中山大學,未經中山大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010018788.4/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:顯示面板及其制備方法
- 下一篇:量子阱可調諧短腔激光器





