[發(fā)明專利]一種基于進(jìn)化搜索的蛋白質(zhì)構(gòu)象空間優(yōu)化方法在審
| 申請(qǐng)?zhí)枺?/td> | 202110299297.6 | 申請(qǐng)日: | 2021-03-21 |
| 公開(公告)號(hào): | CN112967751A | 公開(公告)日: | 2021-06-15 |
| 發(fā)明(設(shè)計(jì))人: | 彭紹亮;陳健;王小奇;陳東;李肯立 | 申請(qǐng)(專利權(quán))人: | 湖南大學(xué) |
| 主分類號(hào): | G16B10/00 | 分類號(hào): | G16B10/00;G16B15/00;G06N3/12 |
| 代理公司: | 國防科技大學(xué)專利服務(wù)中心 43202 | 代理人: | 王文惠 |
| 地址: | 410012 湖*** | 國省代碼: | 湖南;43 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 進(jìn)化 搜索 蛋白質(zhì) 構(gòu)象 空間 優(yōu)化 方法 | ||
本發(fā)明屬于生物信息學(xué)、智能優(yōu)化、計(jì)算機(jī)應(yīng)用領(lǐng)域,公開了基于進(jìn)化搜索的蛋白質(zhì)構(gòu)象空間優(yōu)化方法。本發(fā)明包括:用氨基酸序列在第0代時(shí)的隨機(jī)構(gòu)象初始化種群;將種群中個(gè)體按照勢能值排序;選擇低勢能個(gè)體作為當(dāng)前采樣前的父代個(gè)體,對(duì)每一個(gè)父代個(gè)體應(yīng)用片段替換技術(shù)進(jìn)行修改生成子代個(gè)體;對(duì)得到的每一個(gè)子代個(gè)體,應(yīng)用最小化策略進(jìn)行一系列的片段替換運(yùn)動(dòng),映射到附近的極小值狀態(tài);將經(jīng)過最小化策略處理后的所有子代個(gè)體與種群中其他個(gè)體形成的并集經(jīng)過截?cái)噙x擇后選出新的種群。本發(fā)明改進(jìn)了基本進(jìn)化方法的不足,如:容易過早收斂到次優(yōu)區(qū)域。本發(fā)明借助于以局部貪婪搜索為特征的最小化步驟,實(shí)現(xiàn)了采樣能力更高的蛋白質(zhì)構(gòu)象空間探索方法。
技術(shù)領(lǐng)域:
本發(fā)明涉及生物學(xué)信息學(xué)、智能優(yōu)化、計(jì)算機(jī)應(yīng)用領(lǐng)域,尤其涉及的是一種基于進(jìn)化搜索的蛋白質(zhì)構(gòu)象空間優(yōu)化方法。
背景技術(shù):
蛋白質(zhì)結(jié)構(gòu)預(yù)測是計(jì)算結(jié)構(gòu)生物學(xué)領(lǐng)域一直以來的研究熱點(diǎn)之一。蛋白質(zhì)分子由20種常見的氨基酸組成,在其生物活性狀態(tài)下通常維持一定的立體結(jié)構(gòu),并發(fā)揮相應(yīng)的功能。
在蛋白質(zhì)結(jié)構(gòu)研究中,雖然X射線晶體衍射、核磁共振、冷凍電鏡等實(shí)驗(yàn)技術(shù)能夠較準(zhǔn)確地提取到蛋白質(zhì)天然結(jié)構(gòu)中的原子坐標(biāo),但實(shí)驗(yàn)方法在能夠應(yīng)用的目標(biāo)、研究的分辨率以及質(zhì)量等方面,都存在一定的局限性。尤其對(duì)于藥物設(shè)計(jì)的主要靶標(biāo)膜蛋白來說,極難通過此類方法測定其三級(jí)結(jié)構(gòu)。另一方面,在預(yù)測蛋白質(zhì)三級(jí)結(jié)構(gòu)的計(jì)算方法中,從頭預(yù)測則考慮從氨基酸序列所提供的信息中來計(jì)算其天然結(jié)構(gòu)。
從頭預(yù)測領(lǐng)域主要面臨兩大挑戰(zhàn):構(gòu)象空間的高維性和能量表面的崎嶇不平。研究表明,已知目標(biāo)序列,其所有可能的空間排布所構(gòu)成的構(gòu)象空間的大小隨著序列長度的增加呈指數(shù)級(jí)增長。進(jìn)化方法是一種用以解決復(fù)雜的搜索和優(yōu)化問題的隨機(jī)優(yōu)化方法,是眾多從頭預(yù)測研究中用來探索蛋白質(zhì)分子構(gòu)象空間的首選搜索方法。但該方法在搜索過程中所表現(xiàn)出來的貪婪性質(zhì)使得它在可能檢測到天然結(jié)構(gòu)的同時(shí),容易過早收斂到構(gòu)象空間的次優(yōu)區(qū)域,明顯降低搜索效率。
因此,可以對(duì)基本進(jìn)化方法結(jié)合特定領(lǐng)域的技術(shù)做出適當(dāng)?shù)膬?yōu)化實(shí)現(xiàn)對(duì)現(xiàn)有問題的改進(jìn)。
發(fā)明內(nèi)容:
為了克服由于基本進(jìn)化方法中過高的收斂性,從而陷入能量表面的局部極小值區(qū)域。本發(fā)明提出一種采樣效率較高且能提高采樣構(gòu)象質(zhì)量的基于進(jìn)化搜索的蛋白質(zhì)構(gòu)象空間優(yōu)化方法。
本發(fā)明解決其技術(shù)問題所采用的技術(shù)方案是:
一種基于進(jìn)化搜索的蛋白質(zhì)構(gòu)象空間優(yōu)化方法,所述方法包括以下步驟:
1)給定輸入序列信息;
2)參數(shù)初始化:設(shè)置種群規(guī)模Ps,當(dāng)前種群的勢能指標(biāo)ECNT,能量評(píng)估預(yù)算Emin,初始種群搜索軌跡長度N,每一代采樣數(shù)Numchild,運(yùn)動(dòng)計(jì)數(shù)器COUNT;
3)初始化種群:啟動(dòng)Ps條Monte Carlo軌跡,每條軌跡搜索N次,即生成Ps個(gè)初始構(gòu)象;
4)對(duì)當(dāng)前種群P,進(jìn)行如下操作:
4.1)根據(jù)勢能值從P中選出Numchild個(gè)低勢能構(gòu)象作為父代個(gè)體;
4.2)對(duì)父代個(gè)體xi進(jìn)行如下的片段替換運(yùn)動(dòng):
4.2.1)在所述父代個(gè)體序列上隨機(jī)均勻地采樣一個(gè)殘基位置i,則對(duì)應(yīng)產(chǎn)生一個(gè)由3個(gè)連續(xù)殘基構(gòu)成的片段[i,i+2],其中i為父代個(gè)體構(gòu)象鏈上隨機(jī)采樣的殘基編號(hào);
4.2.2)針對(duì)目標(biāo)片段,從其片段庫中隨機(jī)選擇一個(gè)片段構(gòu)型替換目標(biāo)片段得到子代個(gè)體xi′;當(dāng)處理完所有Numchild個(gè)父代個(gè)體時(shí),進(jìn)入步驟4.3),否則返回步驟4.2)處理下一父代個(gè)體;
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于湖南大學(xué),未經(jīng)湖南大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110299297.6/2.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 一種基因內(nèi)含子進(jìn)化重構(gòu)裝置及方法
- 流感H5疫苗
- 基于云進(jìn)化跟蹤太陽能路燈最大功率點(diǎn)的方法及系統(tǒng)
- AprL-進(jìn)化枝蛋白酶變體及其用途
- 一種基于可進(jìn)化脈沖神經(jīng)網(wǎng)絡(luò)的鳶尾花卉分類方法和裝置
- 一種基于環(huán)境性能需求的產(chǎn)品進(jìn)化設(shè)計(jì)決策方法
- 一種分組進(jìn)化的高維粒子群尋優(yōu)方法
- 基于進(jìn)化樹的模擬生物教學(xué)方法以及裝置
- 一種印刷廢氣進(jìn)化處理裝置
- 一種基于進(jìn)化樹的創(chuàng)新設(shè)計(jì)教學(xué)裝置





