[發明專利]一種基于模糊聚類的重疊蛋白質復合物識別方法在審
| 申請號: | 201911241247.1 | 申請日: | 2019-12-06 |
| 公開(公告)號: | CN111128301A | 公開(公告)日: | 2020-05-08 |
| 發明(設計)人: | 魏妮妮 | 申請(專利權)人: | 北部灣大學 |
| 主分類號: | G16B25/10 | 分類號: | G16B25/10;G16B40/00 |
| 代理公司: | 西安研創天下知識產權代理事務所(普通合伙) 61239 | 代理人: | 郭璐 |
| 地址: | 535000 廣*** | 國省代碼: | 廣西;45 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 模糊 重疊 蛋白質 復合物 識別 方法 | ||
1.一種基于模糊聚類的重疊蛋白質復合物識別方法,其特征在于,包括以下步驟:
S1、輸入蛋白質相互作用網絡G,分類個數K,常數α,β,θ,隸屬度終止容限ε,最大迭代步長lmax,然后輸出隸屬度矩陣U,
其中G由一個二元組組成,即G={V,E},
V表示蛋白質復合物的識別問題的頂點,V={vi}(1≤i≤m),其中每個vi表示一個蛋白質,同時V將被劃分成K個簇,表示為其中每個簇被認為是一種已識別的蛋白質復合物,定義uif表示vi屬于Cf簇的隸屬值,即uif表示用來確定vi劃分到蛋白質復合物Cf簇的可能性,
E表示圖中邊的集合,E={eij},其中eij表示蛋白質與蛋白質之間的相互作用關系,如果存在一個eij∈E,則表示蛋白質頂點vi和蛋白質頂點vj在圖G中鄰接關系,隸屬度矩陣被定義為
U=(u1,u2,u3,...,um)
其中ui(1≤i≤m)表示隸屬度分布向量;
S2、將G用一個鄰接矩陣D來進行表示,D=[dij](1≤i,j≤m),其中每個元素dij的取值可以用如下公式表示:
S3、用隨機產生的非負值初始化U,并使用如下公式對U進行規范化處理:
S4、初始化l=1,表示第1步迭代,同時利用如下公式更新λ(l+1):
其中S(l+1)由公式
來計算,
根據的KKT條件,且Ω≥0,ωif可被定義為:
Ω(l+1)由公式來計算,
且假設U中的所有其它元素的uif都是t已知,在經過一些代數操作之后,uif的解為:
則U(l+1)由公式來更新,然后在利用S3中的公式對U(l+1)進行規范化處理,然后再計算計算隸屬度終止容限值:
ε(l+1)=|L(U(l+1),λ(l+1),Ω(l+1))-L(U(l),λ(l),Ω(l)|
S5、當ε(l+1)≤ε或者迭代變量值l>lmax時迭代停止,否則轉到S4中再去去重復執行,最終返回隸屬度矩陣U(l),完成算法的識別過程。
2.根據權利要求1所述的一種基于模糊聚類的重疊蛋白質復合物識別方法,其特征在于,在S1中,定義的目標函數為:
其中s.t.U1=1,U≥0
α,β,和θ是取值在[0,1]之間的常數,
是矩陣U的F范數的平方,
S=[sif]是一個長度為m×K的矩陣,矩陣的每個元素可以由公式表示為:
3.根據權利要求2所述的一種基于模糊聚類的重疊蛋白質復合物識別方法,其特征在于,為了驗證所識別的蛋白質復合物的稠密結構,我們將對目標函數的分析限定在第一項中與D有關的部分,并使用微量表達式進行重寫公式為:
4.根據權利要求1所述的一種基于模糊聚類的重疊蛋白質復合物識別方法,其特征在于,為了度量本文算法所識別的蛋白質復合物與標準集中蛋白質復合物之間的匹配程度,采用匹配率進行度量,匹配率度量表示為MR-measure,定義MR表示為:
其中,bi是標準數據集中的第i個蛋白質復合物,是c∈C是識別出的蛋白質復合物,
n(c,bi)是c和bi共有的蛋白質的數量,
n(c)表示識別出的蛋白質復合c中蛋白質的數量,
n(bi)表示標準數據集中蛋白質復合物bi中蛋白質的數量。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北部灣大學,未經北部灣大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201911241247.1/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種漏洞掃描的方法及裝置
- 下一篇:一種變帶寬自抗擾控制方法





