[發明專利]一種蛋白質互作網絡共定位共表達復合物識別系統及方法在審
| 申請號: | 202010204246.6 | 申請日: | 2020-03-21 |
| 公開(公告)號: | CN111370060A | 公開(公告)日: | 2020-07-03 |
| 發明(設計)人: | 張錦雄;鐘誠 | 申請(專利權)人: | 廣西大學 |
| 主分類號: | G16B25/00 | 分類號: | G16B25/00;G16B40/00 |
| 代理公司: | 重慶市信立達專利代理事務所(普通合伙) 50230 | 代理人: | 陳炳萍 |
| 地址: | 530004 廣西壯族*** | 國省代碼: | 廣西;45 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 蛋白質 網絡 定位 表達 復合物 識別 系統 方法 | ||
1.一種蛋白質互作網絡共定位共表達復合物識別方法,其特征在于,所述蛋白質互作網絡共定位共表達復合物識別方法包括:
步驟一,矩陣數據準備階段:提取蛋白定位數據、基因表達數據、蛋白質間互作數據及蛋白質GO標注數據;
步驟二,分析計算,依次生成蛋白質間帶可靠性得分的相互作用矩陣、蛋白質定位矩陣、基因表達矩陣、基于CC的蛋白質相似矩陣、基于MF的蛋白質相似矩陣和基于BP的蛋白質相似矩陣;
步驟三,核心算法ICJointLE在參數調優設置下識別蛋白質復合物,其過程分為如下3個順序步:
(1)蛋白質復合物核心識別階段:按照核心-附件結構,運用種子擴張策略,挖掘稠密可靠連接的聯合共定位聯合共表達蛋白質核心;
(2)蛋白質復合物附件添加階段:添加強可靠連接的聯合共定位聯合共表達蛋白質附件;
(3)重疊蛋白質復合物篩選階段:刪除低可靠連接密度的重疊復合物;
步驟四,以CYC2008為參照對識別復合物進行質量評價。
2.如權利要求1所述的蛋白質互作網絡共定位共表達復合物識別方法,其特征在于,所述蛋白質互作網絡共定位共表達復合物識別方法采用釀酒酵母yeast數據集。
3.如權利要求1所述的蛋白質互作網絡共定位共表達復合物識別方法,其特征在于,所述CYC2008作為已知復合物集,其中包含408個人工整理的異聚體蛋白質復合物;基因表達數據GSE3431不僅包含3個連續代謝周期的基因表達數據,而且含有表達基因的3類GO術語標注。
4.如權利要求1所述的蛋白質互作網絡共定位共表達復合物識別方法,其特征在于,所述ICJointLE能識別CYC2008中含無蛋白定位數據蛋白質的復合物的方法為:CYC2008數據集和PPI數據集中的部分蛋白質沒有蛋白定位數據,在計算包含缺乏蛋白定位數據蛋白質的蛋白質組的聯合共定位計數時,設置缺乏蛋白定位數據蛋白質的定位向量為全1。
5.一種實施權利要求1~4任意一項所述蛋白質互作網絡共定位共表達復合物識別方法的蛋白質互作網絡共定位共表達復合物識別系統,其特征在于,所述蛋白質互作網絡共定位共表達復合物識別系統包括:
數據提取模塊,用于提取蛋白定位數據、基因表達數據、蛋白質間互作數據及蛋白質GO標注數據;
矩陣數據生成模塊,用于依次生成蛋白質間帶可靠性得分的相互作用矩陣、蛋白質定位矩陣、基因表達矩陣、基于CC的蛋白質相似矩陣、基于MF的蛋白質相似矩陣和基于BP的蛋白質相似矩陣;
識別評價模塊,用于通過核心算法ICJointLE在參數調優設置下識別蛋白質復合物,然后以CYC2008為參照對識別復合物進行質量評價;
蛋白質復合物核心挖掘模塊,用于挖掘稠密可靠連接的聯合共定位聯合共表達蛋白質核心;
蛋白質復合物附件添加模塊,用于添加強可靠連接的聯合共定位聯合共表達蛋白質附件;
蛋白質復合物篩選模塊,用于刪除低可靠連接密度的重疊復合物。
6.一種實現權利要求1~4任意一項所述蛋白質互作網絡共定位共表達復合物識別方法的信息數據處理終端。
7.一種計算機可讀存儲介質,包括指令,當其在計算機上運行時,使得計算機執行如權利要求1~4任意一項所述的蛋白質互作網絡共定位共表達復合物識別方法。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于廣西大學,未經廣西大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010204246.6/1.html,轉載請聲明來源鉆瓜專利網。





