[發(fā)明專利]一種基于副本交換和有偏分布估計(jì)的蛋白質(zhì)構(gòu)象空間優(yōu)化方法有效
| 申請(qǐng)?zhí)枺?/td> | 201811000669.5 | 申請(qǐng)日: | 2018-08-30 |
| 公開(公告)號(hào): | CN109461472B | 公開(公告)日: | 2021-02-26 |
| 發(fā)明(設(shè)計(jì))人: | 李章維;肖璐倩;余寶昆;劉俊;周曉根;張貴軍 | 申請(qǐng)(專利權(quán))人: | 浙江工業(yè)大學(xué) |
| 主分類號(hào): | G16B15/20 | 分類號(hào): | G16B15/20 |
| 代理公司: | 杭州斯可睿專利事務(wù)所有限公司 33241 | 代理人: | 王利強(qiáng) |
| 地址: | 310014 浙江省*** | 國省代碼: | 浙江;33 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 副本 交換 分布 估計(jì) 蛋白質(zhì) 構(gòu)象 空間 優(yōu)化 方法 | ||
一種基于副本交換和有偏分布估計(jì)的蛋白質(zhì)構(gòu)象空間優(yōu)化方法,首先,根據(jù)種群初始化得到多個(gè)在不同溫度下初始化后副本種群構(gòu)象;然后,交換相鄰溫度的種群個(gè)體,增加了構(gòu)象空間采樣的多樣性;在完成副本交換最大迭代次數(shù)后,統(tǒng)計(jì)每個(gè)片段的組裝概率,使用有偏分布估計(jì)算法,獲得比例更高的低能量構(gòu)象,加快了搜索向全局最優(yōu)收斂的速度,提高了搜索效率;最后,將所有副本種群合并成一個(gè)種群,按能量由低到高排序,挑選排名靠前的優(yōu)秀個(gè)體作為最終種群個(gè)體,輸出最終種群構(gòu)象,本發(fā)明提供一種預(yù)測精度較高的基于副本交換和有偏分布估計(jì)的蛋白質(zhì)構(gòu)象空間優(yōu)化方法。
技術(shù)領(lǐng)域
本發(fā)明是一種涉及生物信息學(xué)、計(jì)算機(jī)應(yīng)用領(lǐng)域,分子動(dòng)力學(xué)模擬,具體涉及的一種基于副本交換和有偏分布估計(jì)的群體蛋白質(zhì)構(gòu)象空間優(yōu)化方法。
背景技術(shù)
生物體的基因組規(guī)定了所有構(gòu)成該生物體的蛋白質(zhì),基因規(guī)定了蛋白質(zhì)的氨基酸序列。雖然蛋白質(zhì)由氨基酸的線性序列組成,但是它們只有折疊成特定的空間構(gòu)象才能具有相應(yīng)的活性和生物學(xué)功能。了解蛋白質(zhì)的空間結(jié)構(gòu)不僅有利于認(rèn)識(shí)蛋白質(zhì)的功能,也有利于認(rèn)識(shí)蛋白質(zhì)是如何執(zhí)行其功能的。
對(duì)蛋白質(zhì)的三維結(jié)構(gòu)進(jìn)行研究,有利于更好地了解蛋白質(zhì)的作用和功能以及蛋白質(zhì)之間的相互作用,這對(duì)于生物學(xué)、醫(yī)學(xué)、藥學(xué)等其他方面的研究都是非常重要的。主要的研究方法可分為兩大類,其一是利用實(shí)驗(yàn)的方法來測定蛋白質(zhì)三維結(jié)構(gòu),包括X光繞射和核磁共振;其二則是利用計(jì)算方法預(yù)測蛋白質(zhì)三維結(jié)構(gòu),包括同源建模法、折疊識(shí)別法以及從頭預(yù)測法三種。雖然用實(shí)驗(yàn)的方法較為準(zhǔn)確,但花費(fèi)的時(shí)間長,而且受到技術(shù)和設(shè)備上的制約。而用理論方法則可以避免這些缺點(diǎn),所以有很大的發(fā)展?jié)摿Α?0世紀(jì)60年代前后,Anfinsen等人通過對(duì)核酶蛋白的復(fù)性研究,提出了著名的蛋白結(jié)構(gòu)形成的熱力學(xué)的觀點(diǎn):蛋白質(zhì)的天然結(jié)構(gòu)具有熱穩(wěn)定性,對(duì)應(yīng)于自由能的一個(gè)全局最小點(diǎn),蛋白質(zhì)的結(jié)構(gòu)信息可以由其氨基酸序列所決定。從此根據(jù)蛋白質(zhì)的氨基酸序列從理論上預(yù)測蛋白質(zhì)的三維結(jié)構(gòu)就成為蛋白質(zhì)研究領(lǐng)域的重要研究方向。目前從頭蛋白質(zhì)結(jié)構(gòu)預(yù)測方法是一種常用的蛋白質(zhì)結(jié)構(gòu)預(yù)測方法,由于它僅利用一級(jí)序列信息進(jìn)行預(yù)測,而不需要任何其它已知蛋白質(zhì)結(jié)構(gòu)信息,所以該方法也是一種較理想的預(yù)測方法。其基本策略是:一定環(huán)境中天然蛋白質(zhì)的三維結(jié)構(gòu)是整個(gè)系統(tǒng)自由能最小的結(jié)構(gòu)。要實(shí)現(xiàn)這一方法有兩個(gè)關(guān)鍵:一是要有一個(gè)合理的勢(shì)函數(shù),勢(shì)函數(shù)的全局極小點(diǎn)對(duì)應(yīng)于蛋白質(zhì)的天然結(jié)構(gòu);二是要有一個(gè)高效額構(gòu)象空間搜索算法,保證在有效的計(jì)算時(shí)間內(nèi)找到勢(shì)函數(shù)的全局最小。在蛋白質(zhì)結(jié)構(gòu)從頭預(yù)測的過程中,能量函數(shù)的不精確以及采樣能力的不足導(dǎo)致預(yù)測結(jié)果并不理想。
發(fā)明內(nèi)容
為了克服現(xiàn)有的蛋白質(zhì)結(jié)構(gòu)預(yù)測方法采樣效率低和預(yù)測精度不足的缺陷,本發(fā)明提出一種基于副本交換和有偏分布估計(jì)的群體蛋白質(zhì)構(gòu)象空間優(yōu)化方法,本發(fā)明使用副本交換和有偏分布估計(jì)方法,利用副本交換增強(qiáng)對(duì)構(gòu)象空間的采樣能力,同時(shí)有偏分布估計(jì)方法使算法快速的向全局最優(yōu)結(jié)果收斂。
本發(fā)明解決其技術(shù)問題所采用的技術(shù)方案是:
一種基于副本交換和有偏分布估計(jì)的群體蛋白質(zhì)構(gòu)象空間優(yōu)化方法,所述方法包括以下步驟:
1)輸入預(yù)測蛋白質(zhì)的序列信息;
2)參數(shù)設(shè)置:種群規(guī)模NP,最大迭代次數(shù)Gmax,副本層數(shù)M,起始溫度KT1,終止溫度KTM,片段插入次數(shù)N,Rosetta Score3能量函數(shù);
3)種群初始化,過程如下:
3.1)生成M個(gè)副本種群{PR1,PR2,...,PRM},其中m∈{1,2,...,M},表示第m個(gè)副本種群中的第n個(gè)個(gè)體,n∈{1,2,...,NP};
3.2)按如下公式設(shè)置第m個(gè)副本種群PRm的溫度KTm:
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于浙江工業(yè)大學(xué),未經(jīng)浙江工業(yè)大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811000669.5/2.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 一種用于數(shù)據(jù)網(wǎng)格的全分布式副本定位方法
- 一種基于核密度估計(jì)的副本選擇方法
- 一種分布式文件系統(tǒng)復(fù)制元數(shù)據(jù)的方法
- 一種對(duì)象存儲(chǔ)系統(tǒng)中對(duì)象一致性操作的方法
- 一種基于云計(jì)算的虛擬化容忍入侵的方法及裝置
- 副本部署方法、云服務(wù)器及存儲(chǔ)介質(zhì)
- 一種管理副本的方法、裝置、服務(wù)器及存儲(chǔ)介質(zhì)
- 主備副本選舉方法、系統(tǒng)、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)
- 一種副本管理方法、裝置、電子設(shè)備及存儲(chǔ)介質(zhì)
- 游戲副本的生成方法、裝置及設(shè)備





