[發明專利]一種基于模板自適應選擇的多域蛋白結構組裝方法有效
| 申請號: | 201710757199.6 | 申請日: | 2017-08-29 |
| 公開(公告)號: | CN107609345B | 公開(公告)日: | 2020-11-27 |
| 發明(設計)人: | 張貴軍;周曉根;王柳靜;郝小虎 | 申請(專利權)人: | 浙江工業大學 |
| 主分類號: | G16B20/00 | 分類號: | G16B20/00 |
| 代理公司: | 杭州斯可睿專利事務所有限公司 33241 | 代理人: | 王利強 |
| 地址: | 310014 浙江省*** | 國省代碼: | 浙江;33 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 模板 自適應 選擇 蛋白 結構 組裝 方法 | ||
一種基于模板自適應選擇的多域蛋白結構組裝方法,首先,利用蛋白質比對工具對多域蛋白庫的中各模板進行打分,并根據打分進行降序排名;然后,選擇出排名靠前的部分模板進行組裝,并對每個模板設置一個選擇概率;其次,在組裝過程中,每隔一定的階段,根據各模板組裝得到的結構被成功接收的次數和該模板被選擇的次數動態更新各模板被選擇的概率;最后,在每次迭代中,根據各模板的選擇概率,利用輪盤賭選擇出一個模板產生的結構進行隨機選擇和平移,從而產生新的結構。本發明提供一種計算代價較低、預測精度較高的基于模板自適應選擇的多域蛋白結構組裝方法。
技術領域
本發明涉及一種生物學信息學、智能優化、計算機應用領域,尤其涉及的是一種基于模板自適應選擇的多域蛋白結構組裝方法。
背景技術
不同的蛋白中通常包含具有特定功能的域蛋白,生物體中所必需的成千上萬種蛋白正是通過一系列這樣的域蛋白組成的。數據顯示,域蛋白的大小不等,從幾個氨基酸到超過800個的氨基酸,而絕大數域蛋白為50-150個氨基酸組成。由這些域蛋白組成的蛋白稱為多域蛋白,簡單的多域蛋白通常包含1-2個域蛋白,較大的多域蛋白可能30個以上所需的復雜細胞功能域蛋白。據統計,至少有2/3的哺乳動物蛋白為多域蛋白。因此,對多域蛋白的結構預測極其重要。
目前,最常用的多域蛋白結構預測方法為剛體對接法,即固定各單域蛋白的結構,然后通過旋轉和平移來選擇方向,從而完成多域蛋白的結構組裝。在組裝中,通常利用各種方法(如基于一級和二級結構的穿線法、基于三級結構的模板搜索法)來搜索蛋白質庫而獲得最佳模板,從而根據模板的方向指導整個組裝過程。但是,由于模板打分函數的不精確性,無法保證得分最高的模板即為實際最佳模板。為了解決上述問題,大多數方法采用多個模板進行獨立組裝,然后對各模板組裝得到的結構進行打分,從而選出得分最高的結構。然而,采用多個模板進行獨立組裝會增加計算代價,而且由于結構打分函數的不精確性,不能保證最后選擇出的結果為實際最優結果,從而影響組裝精度。
因此,現有的基于模板的多域蛋白結構組裝方法在計算代價和預測精度方面存在著缺陷,需要改進。
發明內容
為了克服現有的基于模板的多域蛋白結構組裝方法在計算代價和預測精度方面的不足,本發明提供一種計算代價較低、預測精度較高的基于模板自適應選擇的多域蛋白結構組裝方法。
本發明解決其技術問題所采用的技術方案是:
一種基于模板自適應選擇的多域蛋白結構組裝方法,所述方法包括以下步驟:1)輸入各單域蛋白的三維結構;
2)設置組裝模板數量T,最大迭代次數Imax,沖突距離閾值dcl,相互作用閾值dct,各模板的選擇概率pt,t=1,2,...,T,pt表示第t個模板的選擇概率,學習間隔Iinter;
3)利用模板比對工具TM-align對多域蛋白庫中的每個模板進行打分,并根據打分進行降序排列;
4)選出打分最高的前T個模板進行組裝,過程如下:4.1)將各單域蛋白重疊到各個模板上,得到T個結構,并根據如下公式對各結
構進行打分:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于浙江工業大學,未經浙江工業大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710757199.6/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:可變剪切分析方法
- 下一篇:基因組IIB型限制內切酶位點預測方法及電子設備





