[發明專利]基于混沌蜂群算法的蛋白質三維結構預測方法有效
| 申請號: | 201210406292.X | 申請日: | 2012-10-23 |
| 公開(公告)號: | CN102915407A | 公開(公告)日: | 2013-02-06 |
| 發明(設計)人: | 郭躬德;王怡;孔祥增 | 申請(專利權)人: | 福建師范大學 |
| 主分類號: | G06F19/16 | 分類號: | G06F19/16;G06N3/00 |
| 代理公司: | 福州元創專利商標代理有限公司 35100 | 代理人: | 蔡學俊 |
| 地址: | 350007 *** | 國省代碼: | 福建;35 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 混沌 蜂群 算法 蛋白質 三維 結構 預測 方法 | ||
技術領域
本發明涉及蛋白質三維結構預測技術領域,特別是一種基于混沌蜂群算法的蛋白質三維結構預測方法。
背景技術
蛋白質結構預測問題也稱為蛋白質折疊問題。蛋白質折疊結構的形狀在很大程度上決定了其生物功能,掌握蛋白質的結構信息對于研究蛋白質的功能和作用具有重要的意義。因此,蛋白質三維結構預測已成為生物信息學重要的研究問題之一。
目前,蛋白質結構的測定技術主要有X射線晶體衍射法(X-ray?diffraction)、核磁共振技術(nuclear?magnetic?resonance,?NMR)。盡管蛋白質結構測定技術有了較為顯著的進展,但是通過實驗方法確定蛋白質結構的過程仍然非常復雜,代價較高。因此,出現了許多利用計算機預測蛋白質結構的方法,主要包括:同源建模法(homology?modeling)、折疊識別法(folding?recognition)、從頭預測法(abinitio?method)等。
基于Anfinesen等在1973年提出的蛋白質天然構象對應能量最低的熱力學假說,使用理論計算方法從氨基酸序列預測蛋白質的天然結構成為可能。蛋白質折疊預測問題轉化為兩個關鍵問題:一是提出能更好地反映氨基酸殘基間相互作用和環境等的數學模型;二是根據熱力學假設發展高效的搜索方法,從蛋白質的勢能表面上的多個局部極小值中搜索全局最小值。隨著蛋白質序列長度的增加,搜索空間的計算量呈指數增長。因此,必須建立一個能區分蛋白質的天然構象與非天然構象的粗粒模型。目前被廣泛應用的是AB非格模型,它認為蛋白質結構形成過程中最主要的力是疏水作用,將氨基酸抽象為疏水性(Hydrophobic)和親水性(Hydrophilic)。在AB非格模型的基礎上,設計一個優化算法來搜索最好的蛋白質天然構象成為蛋白質三維結構預測問題的關鍵。然而,即使應用了簡化的模型,蛋白質結構預測依然是一個NP困難問題。
在過去的幾十年間,學者們在預測蛋白質三維結構問題上提出了許多算法來解決搜索全局最優解問題。例如,遺傳算法與模擬退火算法相結合的方法,比其他的方法更具高效性;改進的禁忌搜索算法,避免了算法迂回搜索,提高了算法的搜索性能和魯棒性;將禁忌算法應用于遺傳算法中,快速準確地搜索到蛋白質的結構,比其他算法求得的最低能量更低。然而,這些方法結合了多種算法,運行時間長、效率低,具有一定的局限性。
發明內容
本發明的目的在于提供一種基于混沌蜂群算法的蛋白質三維結構預測方法,該方法不僅具有較好的預測性能和預測精度,而且運行時間短,運行效率高。
本發明的目的是按如下的技術方案實現的:本發明基于混沌蜂群算法的蛋白質三維結構預測方法,對于含有n個殘基的蛋白質,將蛋白質三維結構抽象成2n-5維空間中的一個點,即混沌蜂群算法中食物源的位置,然后采用混沌蜂群算法按如下步驟進行蛋白質三維結構預測:
(1)?初始化參數:食物源規模SN,算法最大循環次數Maxloop,搜索次數limit,混沌搜索最大迭代次數Cmax,種群最小能量值Emin和最優個體hmin,設置算法當前迭代次數loopcount=0,食物源搜索計數器ci=0(i=1,2,...,SN);
(2)?隨機產生SN個食物源????????????????????????????????????????????????;
(3)?采用公式計算所有食物源的能量值,得到最優能量E0及其對應的最優解h0,更新當前最優解hmin=h0和當前最優能量Emin=E0;
(4)?每完成一次步驟(3)的計算,則當前迭代次數loopcount加1,并判斷當前迭代次數loopcount是否小于最大循環次數Maxloop,是則轉步驟(5),否則終止算法,輸出全局最優解hmin和全局最優能量Emin;
(5)?按公式搜索所有食物源的領域解,計算其能量值,若新食物源的能量值低于原食物源的能量值,則用新食物源替換原食物源,否則保留原食物源,且對應的搜索計數器c加1;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于福建師范大學,未經福建師范大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201210406292.X/2.html,轉載請聲明來源鉆瓜專利網。
- 同類專利
- 專利分類
G06F 電數字數據處理
G06F19-00 專門適用于特定應用的數字計算或數據處理的設備或方法
G06F19-10 .生物信息學,即計算分子生物學中的遺傳或蛋白質相關的數據處理方法或系統
G06F19-12 ..用于系統生物學的建模或仿真,例如:概率模型或動態模型,遺傳基因管理網絡,蛋白質交互作用網絡或新陳代謝作用網絡
G06F19-14 ..用于發展或進化的,例如:進化的保存區域決定或進化樹結構
G06F19-16 ..用于分子結構的,例如:結構排序,結構或功能關系,蛋白質折疊,結構域拓撲,用結構數據的藥靶,涉及二維或三維結構的
G06F19-18 ..用于功能性基因組學或蛋白質組學的,例如:基因型–表型關聯,不均衡連接,種群遺傳學,結合位置鑒定,變異發生,基因型或染色體組的注釋,蛋白質相互作用或蛋白質核酸的相互作用





