[發明專利]一種構象空間動態步長搜索方法有效
申請號: | 201410362507.1 | 申請日: | 2014-07-28 |
公開(公告)號: | CN104200132B | 公開(公告)日: | 2017-04-19 |
發明(設計)人: | 張貴軍;郝小虎;秦傳慶;周曉根;程正華;陳銘;明潔 | 申請(專利權)人: | 浙江工業大學 |
主分類號: | G06F19/16 | 分類號: | G06F19/16 |
代理公司: | 杭州斯可睿專利事務所有限公司33241 | 代理人: | 王利強 |
地址: | 310014 浙江省*** | 國省代碼: | 浙江;33 |
權利要求書: | 查看更多 | 說明書: | 查看更多 |
摘要: | |||
搜索關鍵詞: | 一種 構象 空間 動態 步長 搜索 方法 | ||
技術領域
本發明涉及生物信息學、計算機應用領域,尤其涉及的是一種構象空間動態步長搜索方法。
背景技術
蛋白質分子在生物細胞化學反應過程中起著至關重要的作用。它們的結構模型和生物活性狀態對我們理解和治愈多種疾病有重要的意義。蛋白質只有折疊成特定的三維結構才能產生其特有的生物學功能。因此,要了解蛋白質的功能,就必須獲得其三維空間結構。
蛋白質三級結構預測是生物信息學的一個重要任務。目前,蛋白質結構預測方法大致可以分為兩類,基于模板的方法和不基于模板的方法。其中,不基于模板的從頭預測(Ab-inito)方法應用最為廣泛。它適用于同源性小于25%的大多數蛋白質,僅從序列產生全新結構,對蛋白質分子設計及蛋白質折疊的研究等具有重要意義。當前有以下幾種比較成功的從頭預測方法:張陽與Jeffrey Skolnick合作的TASSER(Threading/Assembly/Refinement)方法、David Baker及團隊設計的Rosetta方法、Shehu等設計的FeLTr方法等。但是到目前還沒有一種十分完善的方法來預測蛋白質的三維結構,即使獲得了很好的預測結果,但也只是針對某些蛋白質而言的,目前主要的技術瓶頸在于兩個方面,第一方面在于采樣方法,現有技術對構象空間采樣能力不強,另一方面在于構象更新方法,現有技術對構象的更新精度仍然不足。
因此,現有的構象空間搜索方法存在不足,需要改進。
發明內容
針對上述問題,我們提出在低能量引導的樹搜索框架下,利用動態步長搜索蛋白質構象空間的方法,增強了構象跳出局部極小點的能力,進而增強對構象空間中近天然態構象搜索的能力。
本發明解決其技術問題所采用的技術方案是:
一種構象空間動態步長搜索方法,所述搜索方法包括以下步驟:
1)構象空間初始化:對構象空間按照能量和溫度分層,在每一層中再細分得到“構象室”,完成構象空間的初始化,過程如下:
1.1)對構象空間按照能量分層,劃分成一維網格,能量值以δE為間隔,從最低能量到最高能量分層,表示為[Emin,Emax];
1.2)對構象空間按照溫度分層,劃分成一維網格,由起始溫度逐步非等間隔的到最低溫度,表示為[Tmax,Tmin];
1.3)在每一個能量層,按照三維幾何投影將每層劃分成若干“構象室”,稱之為cell;
2)構象初始化:隨機擾動氨基酸序列得到一個初始構象,通過Rosetta Score3計算得到其能量值,存入相應能量層的構象室中,完成構象初始化,過程如下:
2.1)輸入一個氨基酸序列;
2.2)由蛋白質結構數據庫(PDB庫)生成的片段庫中任意選取片段,對氨基酸序列進行擾動,得到初始構象;
2.3)調用Rosetta Score3能量函數,計算得到的初始構象的能量值;
2.4)依據能量值選定該構象所在的能量層;
2.5)由超速形狀識別(USR)判別將該構象置入指定cell;
3)系統參數初始化:對所分能量層分配權重,在不同能量層賦予不同的片段組裝(FA)步長和Monte Carlo擾動(MC)步長,同時設置溫度參數列表,設定迭代次數,完成系統參數初始化,過程如下:
3.1)對能量層分配權重,權重值由以下公式給出:其中l表示能量層,表示該層平均能量的平方,ω(l)表示權重值;
3.2)設置動態片段組裝(FA)步長,由以下公式給出:其中N為序列長度,M為常數;
3.3)設置動態Monte Carlo擾動(MC)步長,由以下公式給出:其中N為序列長度,Q為常數,由以上公式反向分配步長值;
3.4)初始溫度值根據區間分半搜索方法來確定,從而非等間隔的建立溫度列表[Tmax,Tmin];
3.5)設置迭代次數;
4)構象系綜更新:按照權重依次隨機選中能量層、構象室、構象,進行構象擴展,采用相應的Metropolis準則來判斷是否接收當前構象,完成構象系綜更新,過程如下:
4.1)按照能量權重值依概率隨機的反向選能量層l;
4.2)按照概率1/[(1+nsel)confs]選定“構象室”cell,其中,nsel表示當前cell被選擇的頻次,confs表示當前cell中構象的數目;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于浙江工業大學,未經浙江工業大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201410362507.1/2.html,轉載請聲明來源鉆瓜專利網。
- 同類專利
- 專利分類
G06F 電數字數據處理
G06F19-00 專門適用于特定應用的數字計算或數據處理的設備或方法
G06F19-10 .生物信息學,即計算分子生物學中的遺傳或蛋白質相關的數據處理方法或系統
G06F19-12 ..用于系統生物學的建模或仿真,例如:概率模型或動態模型,遺傳基因管理網絡,蛋白質交互作用網絡或新陳代謝作用網絡
G06F19-14 ..用于發展或進化的,例如:進化的保存區域決定或進化樹結構
G06F19-16 ..用于分子結構的,例如:結構排序,結構或功能關系,蛋白質折疊,結構域拓撲,用結構數據的藥靶,涉及二維或三維結構的
G06F19-18 ..用于功能性基因組學或蛋白質組學的,例如:基因型–表型關聯,不均衡連接,種群遺傳學,結合位置鑒定,變異發生,基因型或染色體組的注釋,蛋白質相互作用或蛋白質核酸的相互作用