[發(fā)明專利]一種基于模板自適應(yīng)選擇的多域蛋白結(jié)構(gòu)組裝方法有效
| 申請(qǐng)?zhí)枺?/td> | 201710757199.6 | 申請(qǐng)日: | 2017-08-29 |
| 公開(kāi)(公告)號(hào): | CN107609345B | 公開(kāi)(公告)日: | 2020-11-27 |
| 發(fā)明(設(shè)計(jì))人: | 張貴軍;周曉根;王柳靜;郝小虎 | 申請(qǐng)(專利權(quán))人: | 浙江工業(yè)大學(xué) |
| 主分類號(hào): | G16B20/00 | 分類號(hào): | G16B20/00 |
| 代理公司: | 杭州斯可睿專利事務(wù)所有限公司 33241 | 代理人: | 王利強(qiáng) |
| 地址: | 310014 浙江省*** | 國(guó)省代碼: | 浙江;33 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 模板 自適應(yīng) 選擇 蛋白 結(jié)構(gòu) 組裝 方法 | ||
一種基于模板自適應(yīng)選擇的多域蛋白結(jié)構(gòu)組裝方法,首先,利用蛋白質(zhì)比對(duì)工具對(duì)多域蛋白庫(kù)的中各模板進(jìn)行打分,并根據(jù)打分進(jìn)行降序排名;然后,選擇出排名靠前的部分模板進(jìn)行組裝,并對(duì)每個(gè)模板設(shè)置一個(gè)選擇概率;其次,在組裝過(guò)程中,每隔一定的階段,根據(jù)各模板組裝得到的結(jié)構(gòu)被成功接收的次數(shù)和該模板被選擇的次數(shù)動(dòng)態(tài)更新各模板被選擇的概率;最后,在每次迭代中,根據(jù)各模板的選擇概率,利用輪盤(pán)賭選擇出一個(gè)模板產(chǎn)生的結(jié)構(gòu)進(jìn)行隨機(jī)選擇和平移,從而產(chǎn)生新的結(jié)構(gòu)。本發(fā)明提供一種計(jì)算代價(jià)較低、預(yù)測(cè)精度較高的基于模板自適應(yīng)選擇的多域蛋白結(jié)構(gòu)組裝方法。
技術(shù)領(lǐng)域
本發(fā)明涉及一種生物學(xué)信息學(xué)、智能優(yōu)化、計(jì)算機(jī)應(yīng)用領(lǐng)域,尤其涉及的是一種基于模板自適應(yīng)選擇的多域蛋白結(jié)構(gòu)組裝方法。
背景技術(shù)
不同的蛋白中通常包含具有特定功能的域蛋白,生物體中所必需的成千上萬(wàn)種蛋白正是通過(guò)一系列這樣的域蛋白組成的。數(shù)據(jù)顯示,域蛋白的大小不等,從幾個(gè)氨基酸到超過(guò)800個(gè)的氨基酸,而絕大數(shù)域蛋白為50-150個(gè)氨基酸組成。由這些域蛋白組成的蛋白稱為多域蛋白,簡(jiǎn)單的多域蛋白通常包含1-2個(gè)域蛋白,較大的多域蛋白可能30個(gè)以上所需的復(fù)雜細(xì)胞功能域蛋白。據(jù)統(tǒng)計(jì),至少有2/3的哺乳動(dòng)物蛋白為多域蛋白。因此,對(duì)多域蛋白的結(jié)構(gòu)預(yù)測(cè)極其重要。
目前,最常用的多域蛋白結(jié)構(gòu)預(yù)測(cè)方法為剛體對(duì)接法,即固定各單域蛋白的結(jié)構(gòu),然后通過(guò)旋轉(zhuǎn)和平移來(lái)選擇方向,從而完成多域蛋白的結(jié)構(gòu)組裝。在組裝中,通常利用各種方法(如基于一級(jí)和二級(jí)結(jié)構(gòu)的穿線法、基于三級(jí)結(jié)構(gòu)的模板搜索法)來(lái)搜索蛋白質(zhì)庫(kù)而獲得最佳模板,從而根據(jù)模板的方向指導(dǎo)整個(gè)組裝過(guò)程。但是,由于模板打分函數(shù)的不精確性,無(wú)法保證得分最高的模板即為實(shí)際最佳模板。為了解決上述問(wèn)題,大多數(shù)方法采用多個(gè)模板進(jìn)行獨(dú)立組裝,然后對(duì)各模板組裝得到的結(jié)構(gòu)進(jìn)行打分,從而選出得分最高的結(jié)構(gòu)。然而,采用多個(gè)模板進(jìn)行獨(dú)立組裝會(huì)增加計(jì)算代價(jià),而且由于結(jié)構(gòu)打分函數(shù)的不精確性,不能保證最后選擇出的結(jié)果為實(shí)際最優(yōu)結(jié)果,從而影響組裝精度。
因此,現(xiàn)有的基于模板的多域蛋白結(jié)構(gòu)組裝方法在計(jì)算代價(jià)和預(yù)測(cè)精度方面存在著缺陷,需要改進(jìn)。
發(fā)明內(nèi)容
為了克服現(xiàn)有的基于模板的多域蛋白結(jié)構(gòu)組裝方法在計(jì)算代價(jià)和預(yù)測(cè)精度方面的不足,本發(fā)明提供一種計(jì)算代價(jià)較低、預(yù)測(cè)精度較高的基于模板自適應(yīng)選擇的多域蛋白結(jié)構(gòu)組裝方法。
本發(fā)明解決其技術(shù)問(wèn)題所采用的技術(shù)方案是:
一種基于模板自適應(yīng)選擇的多域蛋白結(jié)構(gòu)組裝方法,所述方法包括以下步驟:1)輸入各單域蛋白的三維結(jié)構(gòu);
2)設(shè)置組裝模板數(shù)量T,最大迭代次數(shù)Imax,沖突距離閾值dcl,相互作用閾值dct,各模板的選擇概率pt,t=1,2,...,T,pt表示第t個(gè)模板的選擇概率,學(xué)習(xí)間隔Iinter;
3)利用模板比對(duì)工具TM-align對(duì)多域蛋白庫(kù)中的每個(gè)模板進(jìn)行打分,并根據(jù)打分進(jìn)行降序排列;
4)選出打分最高的前T個(gè)模板進(jìn)行組裝,過(guò)程如下:4.1)將各單域蛋白重疊到各個(gè)模板上,得到T個(gè)結(jié)構(gòu),并根據(jù)如下公式對(duì)各結(jié)
構(gòu)進(jìn)行打分:
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于浙江工業(yè)大學(xué),未經(jīng)浙江工業(yè)大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買(mǎi)此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710757199.6/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 使用后向自適應(yīng)規(guī)則進(jìn)行整數(shù)數(shù)據(jù)的無(wú)損自適應(yīng)Golomb/Rice編碼和解碼
- 一種自適應(yīng)軟件UML建模及其形式化驗(yàn)證方法
- 媒體自適應(yīng)參數(shù)的調(diào)整方法、系統(tǒng)及相關(guān)設(shè)備
- 五自由度自適應(yīng)位姿調(diào)整平臺(tái)
- 采用自適應(yīng)機(jī)匣和自適應(yīng)風(fēng)扇的智能發(fā)動(dòng)機(jī)
- 一種自適應(yīng)樹(shù)木自動(dòng)涂白裝置
- 一種基于微服務(wù)的多層次自適應(yīng)方法
- 一種天然氣發(fā)動(dòng)機(jī)燃?xì)庾赃m應(yīng)控制方法及系統(tǒng)
- 一種中心自適應(yīng)的焊接跟蹤機(jī)頭
- 一種有砟軌道沉降自適應(yīng)式軌道系統(tǒng)





