[發明專利]一種基于模糊聚類的重疊蛋白質復合物識別方法在審
| 申請號: | 201911241247.1 | 申請日: | 2019-12-06 |
| 公開(公告)號: | CN111128301A | 公開(公告)日: | 2020-05-08 |
| 發明(設計)人: | 魏妮妮 | 申請(專利權)人: | 北部灣大學 |
| 主分類號: | G16B25/10 | 分類號: | G16B25/10;G16B40/00 |
| 代理公司: | 西安研創天下知識產權代理事務所(普通合伙) 61239 | 代理人: | 郭璐 |
| 地址: | 535000 廣*** | 國省代碼: | 廣西;45 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 模糊 重疊 蛋白質 復合物 識別 方法 | ||
本發明提供了一種基于模糊聚類的重疊蛋白質復合物識別方法,主要是根據同一復合物中蛋白質稠密連接的特性以及蛋白質在蛋白質復合物中的模糊性,構造了一個最大化優化問題,并利用本發明中的算法去解決這個最優化問題,使得對于每種蛋白質,可以確定其對于特定復合物的隸屬度,隸屬關系的模糊性是的迭代計算的,進而能最大限度地提高同一個簇中蛋白質之間相互作用的可能性,能夠很好地完成識別任務,具有更好的準確度,實驗結果表明該算法具有較高的準確性,能夠很好的完成識別任務。
技術領域
本發明屬于蛋白質復合物識別方法技術領域,具體涉及一種基于模糊聚類的重疊蛋白質復合物識別方法。
背景技術
蛋白質復合物作為一種穩定的大分子組裝體,其在執行細胞穩態、生長和增殖等多種多樣的生化活動過程中發揮著重要的作用。由于,蛋白質復合物的識別可以使用我們更好的理解不同細胞系統中的蛋白質機制。因此,近年來從蛋白質相互作用網絡(proteininteraction network,PIN)中進行蛋白質復合物識別的問題受到越來越多的關注。為了實現蛋白質復合物的識別人們提出了大量的生物實驗方法和計算方法。
實驗方法是通過實驗測定來進行蛋白質復合物識別,例如免疫共沉淀和雙雜交系統。基于實驗技術得到的結果可靠,但這種技術存在的主要缺點是識別分析時間長,對于專業知識水平要求較高。因此,計算方法被認為是蛋白質復合物識別的首選方法。一般來說,PIN被定義為一個圖,圖的頂點表示蛋白質,圖中的邊用來表示蛋白質之間的相互作用,蛋白質復合物識別問題可表示為一個圖聚類問題,通過聚類生成的圖形簇被認為是蛋白質復合物。這些圖聚類算法是純粹依賴于PINS的拓撲結構信息去識別遵循某些結構特性的蛋白質復合物的計算方法,其中還有馬爾科夫聚類(MCL)算法是將圖中緊密相連的區域視為蛋白質復合物,并通過使用擴展操作和膨脹操作模擬流動的膨脹和收縮來識別這些區域。MCODE是另一種流行的圖聚類算法,它通過使用節點權重而不是轉移矩陣來考慮局部鄰居密度來檢測 PINS的稠密簇。
上述這些算法在識別蛋白質復合物時是準確的,但是不能確定蛋白質復合物其對于特定復合物的隸屬度,不能最大限度地提高同一個簇中蛋白質之間相互作用的可能性,識別性能較差。
發明內容
本發明所要解決的技術問題在于針對上述現有技術的不足,提供一種基于模糊聚類的重疊蛋白質復合物識別方法,以解決上述背景技術中提出的現有的蛋白質復合物識別方法不能確定蛋白質復合物其對于特定復合物的隸屬度,不能最大限度地提高同一個簇中蛋白質之間相互作用的可能性,識別性能較差問題。
為解決上述技術問題,本發明采用的技術方案是:一種基于模糊聚類的重疊蛋白質復合物識別方法,包括以下步驟:
S1、輸入蛋白質相互作用網絡G,分類個數K,常數α,β,θ,隸屬度終止容限ε,最大迭代步長lmax,然后輸出隸屬度矩陣U,
其中G由一個二元組組成,即G={V,E},
V表示蛋白質復合物的識別問題的頂點,V={vi}(1≤i≤m),其中每個vi表示一個蛋白質,同時V將被劃分成K個簇,表示為其中每個簇被認為是一種已識別的蛋白質復合物,定義uif表示vi屬于 Cf簇的隸屬值,即uif表示用來確定vi劃分到蛋白質復合物Cf簇的可能性,
E表示圖中邊的集合,E={eij},其中eij表示蛋白質與蛋白質之間的相互作用關系,如果存在一個eij∈E,則表示蛋白質頂點vi和蛋白質頂點vj在圖G中鄰接關系,隸屬度矩陣被定義為
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北部灣大學,未經北部灣大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201911241247.1/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種漏洞掃描的方法及裝置
- 下一篇:一種變帶寬自抗擾控制方法





