[發明專利]基于可極化力場以及pso優化的蛋白質設計方法無效
| 申請號: | 201210563431.X | 申請日: | 2012-12-21 |
| 公開(公告)號: | CN103886225A | 公開(公告)日: | 2014-06-25 |
| 發明(設計)人: | 李國輝;張鼎林 | 申請(專利權)人: | 中國科學院大連化學物理研究所 |
| 主分類號: | G06F19/10 | 分類號: | G06F19/10 |
| 代理公司: | 沈陽科苑專利商標代理有限公司 21002 | 代理人: | 許宗富 |
| 地址: | 116023 *** | 國省代碼: | 遼寧;21 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 極化 力場 以及 pso 優化 蛋白質 設計 方法 | ||
技術領域
本發明涉及的是一種計算機預測蛋白功能的方法,屬于生物信息技術、計算方法與計算機虛擬現實技術。
背景技術
計算機輔助蛋白質設計是進行蛋白質設計中重要的手段。但是全序列蛋白質設計有兩個難題。第一個難題就是組合爆炸。簡單舉個例子,針對一個有著100個氨基酸的多肽鏈進行設計,那么序列的組合空間是pow(20,100),這個數字太大了,因此選擇發展好的優化算法就是必須面臨的問題。第二個問題是能量計算函數的速度和精確度相互矛盾,往往難以兼得。如果沒有一個精準的能量函數來識別優化的序列以及構象,再好的優化算法也不能發揮作用。
優化策略:在整個計算過程中,假定主鏈構象不發生變化,會大大的降低計算的復雜度,同時也使得連續的問題轉化成了離散的問題。于是就可以使用各種常用的優化算法來尋找比較好的構象。總的來說在蛋白質設計中,優化算法分成兩類,第一類算法是非窮舉算法,不能保證找到最優構象,這類算法包括MC算法,模擬退火,遺傳算法。這類算法通常適用于在較大的搜索空間搜索比較好的構象,尤其是當構象空間太大以至于使用窮舉算法不可行的時候。第二類算法可以得到最佳構象,這類算法包括,窮舉法,branch?and?bound算法,DEE算法,divide?and?conquer算法。
Mc算法:在一個結構中隨機選擇一個位點,然后按照輪盤賭選擇這個位點上的rotamer。如果變化之后的能量變小了,那么就接受這次變化,否則就按照Metropolis規則,決定是不是接受這次變化。Metropolis規則:通過溫度,變化前后的能量,得到一個概率數字,然后將這個數字與一個隨機數比較,如果隨機數小于概率數字,就接受這次改變,否則就不接受這次改變。這個規則使得構想搜索的時候可以跳出極小值點。可以通過調整溫度來越過能壘。或者使用模擬退火的方式逐步降低越過能壘的可能性。
遺傳算法:遺傳算法來源于遺傳進化理論。首先產生隨機序列的種群,然后選擇低能構象進行雜交,互換序列和rotamer。雜交的結果往往能得到更低能構象。這樣的低能構象被選擇下來,進行下一代的繁殖。高能構象就放棄了。這個過程中包括重組,突變,選擇。重復這個過程,直到收斂。
DEE算法:DEE算法能夠找到全局最優解。DEE算法的一個關鍵因素就是過濾規則。不同的過濾規則在效率上差異顯著。使用DEE算法的前提是將總能量進行分解。分解成任意側鏈對的相互作用能量和側鏈內部的能量,以及側鏈和不變部分的能量。總能量計算的時候是通過求和得到的。
能量函數的選擇。能量函數是用來描述蛋白質內部相互作用的。這個函數用來評價蛋白質的結構好壞。能量函數的選擇是蛋白質設計中另一個重要的因素。當前主流的分子力場amber,charrm,opls.的能量函數通常都有范德華,靜電,氫鍵,鍵長,鍵角,二面角等項。
發明內容
為了克服目前現有技術的不足,本發明提供了一種基于粒子群方法的蛋白質設計方法,本發明采用的技術方案是:基于可極化力場以及pso優化的蛋白質設計方法,包括以下步驟:
通過蛋白質設計模板得到若干個蛋白質;對每一個蛋白質進行如下優化:
在4n維空間中連續移動的每一個粒子的子向量在rotamerlib中尋找最近的rotamer;然后用這些找到的rotamer構造一個臨時的粒子;
計算每個臨時粒子的適應度,并根據這些臨時粒子的適應度更新局部最優粒子以及鄰居最優粒子;并更新所有非臨時粒子位置速度;通過比較所有鄰居最優粒子的位置得到全局最優位置;粒子群優化結束;
用粒子群進行側鏈構象組合空間搜索得到優化后的蛋白質。
所述每一個粒子的子向量代表一個4維的側鏈構象。
計算每個臨時粒子的適應度包括以下步驟:
首先將對應的蛋白質寫到一個字符串中;然后調用tinker內置的pdbxyz模塊進行格式轉化得到analyze可以處理的xyz格式的字符串;調用analyze模塊得到這個蛋白質對應的總能量,這個總能量即為適應度。
所述根據這些臨時粒子的適應度更新局部最優粒子以及鄰居最優粒子包括以下步驟:
每一個粒子都記錄了一個局部最優位置和鄰居最優位置,這個粒子pi移動之后會根據最近原則產生一個臨時粒子tpi,如果tpi的適應度比pi記錄的局部最優位置的適應度好,那么就更新局部最優的記錄;如果tpi的適應度大于pi記錄的鄰居最優記錄的適應度,那么就更新鄰居最優的記錄。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國科學院大連化學物理研究所,未經中國科學院大連化學物理研究所許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201210563431.X/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:具有擋灰裝置的循環流化床脫硫塔
- 下一篇:一種新干法后處理系統
- 同類專利
- 專利分類
G06F 電數字數據處理
G06F19-00 專門適用于特定應用的數字計算或數據處理的設備或方法
G06F19-10 .生物信息學,即計算分子生物學中的遺傳或蛋白質相關的數據處理方法或系統
G06F19-12 ..用于系統生物學的建模或仿真,例如:概率模型或動態模型,遺傳基因管理網絡,蛋白質交互作用網絡或新陳代謝作用網絡
G06F19-14 ..用于發展或進化的,例如:進化的保存區域決定或進化樹結構
G06F19-16 ..用于分子結構的,例如:結構排序,結構或功能關系,蛋白質折疊,結構域拓撲,用結構數據的藥靶,涉及二維或三維結構的
G06F19-18 ..用于功能性基因組學或蛋白質組學的,例如:基因型–表型關聯,不均衡連接,種群遺傳學,結合位置鑒定,變異發生,基因型或染色體組的注釋,蛋白質相互作用或蛋白質核酸的相互作用





