[發明專利]一種基于二級結構知識的蛋白質構象空間優化方法有效
| 申請號: | 201810986056.7 | 申請日: | 2018-08-28 |
| 公開(公告)號: | CN109326319B | 公開(公告)日: | 2021-05-18 |
| 發明(設計)人: | 張貴軍;王小奇;馬來發;周曉根;王柳靜 | 申請(專利權)人: | 浙江工業大學 |
| 主分類號: | G16B15/20 | 分類號: | G16B15/20 |
| 代理公司: | 杭州斯可睿專利事務所有限公司 33241 | 代理人: | 王利強 |
| 地址: | 310014 浙江省*** | 國省代碼: | 浙江;33 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 二級 結構 知識 蛋白質 構象 空間 優化 方法 | ||
一種基于二級結構知識的蛋白質構象空間優化方法,在遺傳算法的基本框架下,對每個目標個體完成基于loop區域的交叉和基于片段組裝的變異;然后,根據預測的二級結構知識和能量函數對目標個體和變異個體分別進行評價;最后,根據每個個體的二級結構得分與能量總得分進行排序,選出適應度較高的個體進入下一代種群。本發明提出一種預測精度高、計算代價低的基于二級結構知識的蛋白質構象空間優化方法。
技術領域
本發明涉及一種生物學信息學、智能優化、計算機應用領域,尤其涉及的是一種基于二級結構知識的蛋白質構象空間優化方法。
背景技術
蛋白質是一種由氨基酸分子組成的有機化合物,是生命體的重要組成部分和生命活動的主要執行者。研究表明,一個蛋白質所具有的特定的生化功能通常由其三維結構所決定。因此,預測蛋白質三維結構是現代生物學研究多方面的基石。
蛋白質的氨基酸序列決定三級結構。在計算生物學領域,通過計算機來預測蛋白質結構的方法根據其序列的同源性可分為兩大類:基于模板的建模和從頭預測。一般來講,對于序列相似度較高的情況,基于模板的預測精度已經很高。列相似度30%的蛋白來說,從頭預測方法是唯一的選擇。通過從頭預測方法建立蛋白結構模型,即直接基于Anfinsen法則建立蛋白質能量模型,然后,再通過構象搜索優化方法得到目標蛋白的天然結構已經成為蛋白質結構預測領域的一個熱點問題。
蛋白質構象空間優化的本質復雜性,使其成為蛋白質從頭預測領域中一個極具挑戰性的研究課題。目前主要的技術瓶頸在于兩個方面,一方面在于現有技術的采樣能力不足;另一方面由于能量函數不精確,所以在獲得能量最優的構象時,并不能挑選出好的構象。考慮到計算代價問題,近十年來研究者陸續提出了一系列基于物理的力場模型、基于知識的力場模型。然而,我們還遠遠無法構建起能引導目標序列朝正確方向折疊的足夠精確力場,導致數學上的最優解并不一定對應于目標蛋白的天然態結構,從而阻礙了高性能算法在蛋白質結構從頭預測領域中的應用。
因此,現有的構象空間優化方法在預測精度和采樣效率方面存在著缺陷,需要改進。
發明內容
為了克服現有的蛋白質構象優化方法中能量函數不精確、預測精度較低的不足,本發明提出一種采樣效率較高、預測精度高的基于二級結構知識的蛋白質構象空間優化方法。
本發明解決其技術問題所采用的技術方案是:
一種基于二級結構知識的蛋白質構象空間優化方法,所述方法包括以下步驟:
1)給定輸入序列信息;
2)利用PSIPRED平臺預測目標蛋白的二級結構信息;
3)選取能量函數E(x);
4)參數初始化:設置種群規模Psize,最大遺傳代數Gmax,初始種群搜索軌跡長度iter,交叉因子CR,變異計數器Co,最大計數值Comax,二級結構和能量的權重ws和we;
5)初始化種群:啟動Psize條Monte Carlo軌跡,每條軌跡搜索iter次,即生成Psize個初始個體;
6)對每個目標個體xi,i∈{i=1,.2..,Psize}進行如下操作:
6.1)隨機選擇一個個體xj,j∈{1,2,...,Psize}且j≠i,若r≤CR則對個體xi和xj進行如下操作,否則x′i=xi轉至步驟6.2),其中r∈[0,1]是隨機數;
6.1.1)在個體xj中,隨機選擇一個loop區域[a,b],其中a是隨機選取的loop區域對應的起點位置,b是終止位置;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于浙江工業大學,未經浙江工業大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810986056.7/2.html,轉載請聲明來源鉆瓜專利網。





