[發明專利]采用覓食機制的人工蜂群優化算法識別關鍵蛋白質的方法有效
| 申請號: | 201710050587.0 | 申請日: | 2017-01-23 |
| 公開(公告)號: | CN106874708B | 公開(公告)日: | 2018-06-22 |
| 發明(設計)人: | 雷秀娟;丁玉連;陸鋮;代才;程適 | 申請(專利權)人: | 陜西師范大學 |
| 主分類號: | G06F19/18 | 分類號: | G06F19/18;G06N3/00 |
| 代理公司: | 西安通大專利代理有限責任公司 61200 | 代理人: | 強宏超 |
| 地址: | 710062 *** | 國省代碼: | 陜西;61 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 關鍵蛋白質 蛋白質相互作用 蜂群 優化算法 鄰域 蜜蜂 覓食 搜索 仿真實驗結果 預處理 核糖核酸 關鍵蛋白 基因表達 全局搜索 網絡轉化 網絡 敏感度 無向圖 準確率 更新 構建 結點 陰性 預測 蛋白質 優化 | ||
1.采用覓食機制的人工蜂群優化算法識別關鍵蛋白質的方法,其特征在于包括以下步驟:
(1)將蛋白質相互作用網絡轉化為無向圖
將蛋白質相互作用網絡轉化成一個無向圖G=(V,E),其中,V={vi,i=1,2,…,n}為結點vi的集合,E為邊e的集合,結點vi表示蛋白質,邊e表示蛋白質之間的相互作用;
(2)對蛋白質相互作用網絡邊和結點的預處理
對結點vi預處理:按式(1)計算結點vi的介數中心性:
式中ρ(s,v,t)表示蛋白質相互作用網絡中結點s與結點t之間經過結點v的最短路徑的條數,ρ(s,t)表示蛋白質相互作用網絡中結點s與結點t之間的最短路徑的條數;
按式(2)計算邊的聚集系數:
式中,Z(vi,vj)表示包含邊(vi,vj)的三角形個數,di,dj分別是點vi,vj的度;
按式(3)計算邊的皮爾森相關系數:
式中,xt,yt表示蛋白質vx,vy在時間點t時的基因表達值,μ(x),μ(y)是蛋白質vx,vy的平均基因表達值,T為時間點的最大值;
(3)構建動態蛋白質相互作用網絡
在時間點t時,蛋白質vi的基因表達值GEit若大于基因表達閾值AT(i),則被認為蛋白質vi在時間點t具有活性;否則認為該結點在時間點t不具有活性;將所有時間點的活性蛋白質組合在一起,對應到原靜態蛋白質相互作用網絡中形成一個新的蛋白質相互作用網絡,即動態蛋白質網絡;
GEit為蛋白質vi在時間點t處的基因表達值;
基因表達閾值AT(i)由式(4)得到:
AT(i)=μ(i)+3σ(i)(1-F(i)) 式(4)
式中μ(i)是蛋白質vi平均基因表達值,σ(i)是基因表達值的標準差,F(i)=1/(1+σ2(i))是權函數;
(4)選取已知關鍵蛋白質作為蜜源
令N為蜜源中包含的已知關鍵蛋白質的數量,在目前已知的關鍵蛋白質中隨機選取N個關鍵蛋白質作為先驗知識的蜜源;Ep_set表示蜜源包含的蛋白質的集合;iter,maxiter分別表示當前迭代次數和最大迭代次數,iter=1,maxiter∈[100,800];
(5)采蜜蜂搜索蜜源鄰域
蜜源的鄰域即與蜜源蛋白質有相互作用的蛋白質結點集合niber_set1,每一個鄰域結點看作一只采蜜蜂;按照score1(i)=relevant(vi,Ep_set)確定采蜜蜂當前所在位置的蜜源收益度及該鄰域結點成為新蜜源的可能性,式中score1(i)為采蜜蜂當前位置的蜜源收益度,vi是采蜜蜂所代表的蛋白質結點,relevant表示蛋白質結點vi與當前蜜源集合Ep_set之間的關聯度;
(6)跟隨蜂搜索采蜜蜂鄰域
設采蜜蜂vi的鄰域即與采蜜蜂所代表的蛋白質有相互作用且不在當前蜜源集合Ep_set內的蛋白質結點集合為niber_set2;跟隨蜂接收采蜜蜂的信息并且對采蜜蜂的鄰域進行搜索,即跟隨蜂根據公式score2(i)=fitness(vi,niber_set2,Ep_set)確定當前位置成為新蜜源的可能性,式中vi是采蜜蜂所代表的蛋白質結點,niber_set2表示采蜜蜂的鄰域蛋白質結點,fitness表示當前位置成為蜜源的適應度;
(7)更新蜜源
對蛋白質結點集合niber_set1中的結點按照其score2得分進行降序排序,將score2的值最高的結點設為最優蜜源位置g_best,將score2第二高的結點作為次優候選蜜源s_best;若score2(g_best)-score2(s_best)>閾值thd,則將g_best作為新蜜源并入到集合Ep_set中,并轉向步驟(5);否則轉向步驟(8);iter迭代加1;
(8)偵查蜂全局搜索新蜜源
偵查蜂對蛋白質相互作用網絡中的除蜜源外的其它蛋白質進行介數中心性計算;然后根據介數中心性的值BC對所有結點進行降序排序,選出介數中心性值最大的結點作為最優蜜源位置g_best;
(9)更新蜜源
將最優蜜源位置g_best作為新蜜源并入到集合Ep_set中;
(10)產生關鍵蛋白質
若iter的值小于等于maxiter,轉向步驟(5);否則,將集合Ep_set中的蛋白質作為關鍵蛋白質輸出。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于陜西師范大學,未經陜西師范大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710050587.0/1.html,轉載請聲明來源鉆瓜專利網。
- 同類專利
- 專利分類
G06F 電數字數據處理
G06F19-00 專門適用于特定應用的數字計算或數據處理的設備或方法
G06F19-10 .生物信息學,即計算分子生物學中的遺傳或蛋白質相關的數據處理方法或系統
G06F19-12 ..用于系統生物學的建模或仿真,例如:概率模型或動態模型,遺傳基因管理網絡,蛋白質交互作用網絡或新陳代謝作用網絡
G06F19-14 ..用于發展或進化的,例如:進化的保存區域決定或進化樹結構
G06F19-16 ..用于分子結構的,例如:結構排序,結構或功能關系,蛋白質折疊,結構域拓撲,用結構數據的藥靶,涉及二維或三維結構的
G06F19-18 ..用于功能性基因組學或蛋白質組學的,例如:基因型–表型關聯,不均衡連接,種群遺傳學,結合位置鑒定,變異發生,基因型或染色體組的注釋,蛋白質相互作用或蛋白質核酸的相互作用





