[發(fā)明專利]一種基于副本交換和有偏分布估計(jì)的蛋白質(zhì)構(gòu)象空間優(yōu)化方法有效

申請(qǐng)?zhí)枺?/td>	201811000669.5	申請(qǐng)日：	2018-08-30
公開（公告）號(hào)：	CN109461472B	公開（公告）日：	2021-02-26
發(fā)明（設(shè)計(jì)）人：	李章維;肖璐倩;余寶昆;劉俊;周曉根;張貴軍	申請(qǐng)（專利權(quán)）人：	浙江工業(yè)大學(xué)
主分類號(hào)：	G16B15/20	分類號(hào)：	G16B15/20
代理公司：	杭州斯可睿專利事務(wù)所有限公司 33241	代理人：	王利強(qiáng)
地址：	310014 浙江省***	國省代碼：	浙江;33
權(quán)利要求書：	查看更多	說明書：	查看更多
摘要：
搜索關(guān)鍵詞：	一種基于副本交換分布估計(jì) 蛋白質(zhì) 構(gòu)象空間優(yōu)化方法
鉆瓜網(wǎng) 技術(shù)展會(huì) 專利詞庫專利權(quán)人專利榜在售專利公布日期熱門專利

【說明書】：

一種基于副本交換和有偏分布估計(jì)的蛋白質(zhì)構(gòu)象空間優(yōu)化方法，首先，根據(jù)種群初始化得到多個(gè)在不同溫度下初始化后副本種群構(gòu)象；然后，交換相鄰溫度的種群個(gè)體，增加了構(gòu)象空間采樣的多樣性；在完成副本交換最大迭代次數(shù)后，統(tǒng)計(jì)每個(gè)片段的組裝概率，使用有偏分布估計(jì)算法，獲得比例更高的低能量構(gòu)象，加快了搜索向全局最優(yōu)收斂的速度，提高了搜索效率；最后，將所有副本種群合并成一個(gè)種群，按能量由低到高排序，挑選排名靠前的優(yōu)秀個(gè)體作為最終種群個(gè)體，輸出最終種群構(gòu)象，本發(fā)明提供一種預(yù)測精度較高的基于副本交換和有偏分布估計(jì)的蛋白質(zhì)構(gòu)象空間優(yōu)化方法。

技術(shù)領(lǐng)域

本發(fā)明是一種涉及生物信息學(xué)、計(jì)算機(jī)應(yīng)用領(lǐng)域，分子動(dòng)力學(xué)模擬，具體涉及的一種基于副本交換和有偏分布估計(jì)的群體蛋白質(zhì)構(gòu)象空間優(yōu)化方法。

背景技術(shù)

生物體的基因組規(guī)定了所有構(gòu)成該生物體的蛋白質(zhì)，基因規(guī)定了蛋白質(zhì)的氨基酸序列。雖然蛋白質(zhì)由氨基酸的線性序列組成，但是它們只有折疊成特定的空間構(gòu)象才能具有相應(yīng)的活性和生物學(xué)功能。了解蛋白質(zhì)的空間結(jié)構(gòu)不僅有利于認(rèn)識(shí)蛋白質(zhì)的功能，也有利于認(rèn)識(shí)蛋白質(zhì)是如何執(zhí)行其功能的。

對(duì)蛋白質(zhì)的三維結(jié)構(gòu)進(jìn)行研究，有利于更好地了解蛋白質(zhì)的作用和功能以及蛋白質(zhì)之間的相互作用，這對(duì)于生物學(xué)、醫(yī)學(xué)、藥學(xué)等其他方面的研究都是非常重要的。主要的研究方法可分為兩大類，其一是利用實(shí)驗(yàn)的方法來測定蛋白質(zhì)三維結(jié)構(gòu)，包括X光繞射和核磁共振；其二則是利用計(jì)算方法預(yù)測蛋白質(zhì)三維結(jié)構(gòu)，包括同源建模法、折疊識(shí)別法以及從頭預(yù)測法三種。雖然用實(shí)驗(yàn)的方法較為準(zhǔn)確，但花費(fèi)的時(shí)間長，而且受到技術(shù)和設(shè)備上的制約。而用理論方法則可以避免這些缺點(diǎn)，所以有很大的發(fā)展?jié)摿Α?0世紀(jì)60年代前后，Anfinsen等人通過對(duì)核酶蛋白的復(fù)性研究，提出了著名的蛋白結(jié)構(gòu)形成的熱力學(xué)的觀點(diǎn)：蛋白質(zhì)的天然結(jié)構(gòu)具有熱穩(wěn)定性，對(duì)應(yīng)于自由能的一個(gè)全局最小點(diǎn)，蛋白質(zhì)的結(jié)構(gòu)信息可以由其氨基酸序列所決定。從此根據(jù)蛋白質(zhì)的氨基酸序列從理論上預(yù)測蛋白質(zhì)的三維結(jié)構(gòu)就成為蛋白質(zhì)研究領(lǐng)域的重要研究方向。目前從頭蛋白質(zhì)結(jié)構(gòu)預(yù)測方法是一種常用的蛋白質(zhì)結(jié)構(gòu)預(yù)測方法，由于它僅利用一級(jí)序列信息進(jìn)行預(yù)測，而不需要任何其它已知蛋白質(zhì)結(jié)構(gòu)信息，所以該方法也是一種較理想的預(yù)測方法。其基本策略是:一定環(huán)境中天然蛋白質(zhì)的三維結(jié)構(gòu)是整個(gè)系統(tǒng)自由能最小的結(jié)構(gòu)。要實(shí)現(xiàn)這一方法有兩個(gè)關(guān)鍵：一是要有一個(gè)合理的勢(shì)函數(shù)，勢(shì)函數(shù)的全局極小點(diǎn)對(duì)應(yīng)于蛋白質(zhì)的天然結(jié)構(gòu)；二是要有一個(gè)高效額構(gòu)象空間搜索算法，保證在有效的計(jì)算時(shí)間內(nèi)找到勢(shì)函數(shù)的全局最小。在蛋白質(zhì)結(jié)構(gòu)從頭預(yù)測的過程中，能量函數(shù)的不精確以及采樣能力的不足導(dǎo)致預(yù)測結(jié)果并不理想。

發(fā)明內(nèi)容

為了克服現(xiàn)有的蛋白質(zhì)結(jié)構(gòu)預(yù)測方法采樣效率低和預(yù)測精度不足的缺陷，本發(fā)明提出一種基于副本交換和有偏分布估計(jì)的群體蛋白質(zhì)構(gòu)象空間優(yōu)化方法，本發(fā)明使用副本交換和有偏分布估計(jì)方法，利用副本交換增強(qiáng)對(duì)構(gòu)象空間的采樣能力，同時(shí)有偏分布估計(jì)方法使算法快速的向全局最優(yōu)結(jié)果收斂。

本發(fā)明解決其技術(shù)問題所采用的技術(shù)方案是：

一種基于副本交換和有偏分布估計(jì)的群體蛋白質(zhì)構(gòu)象空間優(yōu)化方法，所述方法包括以下步驟：

1)輸入預(yù)測蛋白質(zhì)的序列信息；

2)參數(shù)設(shè)置：種群規(guī)模NP，最大迭代次數(shù)G_max，副本層數(shù)M，起始溫度KT₁，終止溫度KT_M，片段插入次數(shù)N，Rosetta Score3能量函數(shù)；

3)種群初始化，過程如下：

3.1)生成M個(gè)副本種群{PR₁,PR₂,...,PR_M}，其中m∈{1,2,...,M}，表示第m個(gè)副本種群中的第n個(gè)個(gè)體，n∈{1,2,...,NP}；

3.2)按如下公式設(shè)置第m個(gè)副本種群PR_m的溫度KT_m：

下載完整專利技術(shù)內(nèi)容需要扣除積分，VIP會(huì)員可以免費(fèi)下載。

免登錄下載普通用戶下載升級(jí)VIP會(huì)員，免費(fèi)下載

該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息，商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于浙江工業(yè)大學(xué)，未經(jīng)浙江工業(yè)大學(xué)許可，擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作，請(qǐng)聯(lián)系【客服】

本文鏈接：http://www.szxzyx.cn/pat/books/201811000669.5/2.html，轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。

同類專利

專利分類

G 物理

免登錄下載普通用戶下載升級(jí)VIP會(huì)員，免費(fèi)下載

專利文獻(xiàn)下載

說明：

1、專利原文基于中國國家知識(shí)產(chǎn)權(quán)局專利說明書；

2、支持發(fā)明專利、實(shí)用新型專利、外觀設(shè)計(jì)專利（升級(jí)中）；

3、專利數(shù)據(jù)每周兩次同步更新，支持Adobe PDF格式；

4、內(nèi)容包括專利技術(shù)的結(jié)構(gòu)示意圖、流程工藝圖或技術(shù)構(gòu)造圖；

5、已全新升級(jí)為極速版,下載速度顯著提升！歡迎使用！

請(qǐng)您登陸后，進(jìn)行下載，點(diǎn)擊【登陸】【注冊(cè)】