[發(fā)明專利]分類模型的建立方法和裝置在審
| 申請?zhí)枺?/td> | 201310279561.5 | 申請日: | 2013-07-04 |
| 公開(公告)號: | CN103310127A | 公開(公告)日: | 2013-09-18 |
| 發(fā)明(設(shè)計(jì))人: | 劉偉;孫志強(qiáng);宮二玲;謝紅衛(wèi) | 申請(專利權(quán))人: | 中國人民解放軍國防科學(xué)技術(shù)大學(xué) |
| 主分類號: | G06F19/12 | 分類號: | G06F19/12 |
| 代理公司: | 北京康信知識(shí)產(chǎn)權(quán)代理有限責(zé)任公司 11240 | 代理人: | 吳貴明;張永明 |
| 地址: | 410073 湖*** | 國省代碼: | 湖南;43 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 分類 模型 建立 方法 裝置 | ||
技術(shù)領(lǐng)域
本發(fā)明涉及分子生物學(xué)領(lǐng)域,具體而言,涉及一種分類模型的建立方法和裝置。
背景技術(shù)
目前,高通量實(shí)驗(yàn)技術(shù)的飛速發(fā)展已經(jīng)產(chǎn)生了大規(guī)模、多物種的蛋白質(zhì)相互作用數(shù)據(jù),許多研究人員致力于研究上述已經(jīng)產(chǎn)生的數(shù)據(jù),以便更好地理解蛋白質(zhì)的功能。蛋白質(zhì)的基本單位是結(jié)構(gòu)域,而且在蛋白質(zhì)之間通常由結(jié)構(gòu)域介導(dǎo)產(chǎn)生相互作用。因此,從結(jié)構(gòu)域角度分析蛋白質(zhì)的相互作用顯得尤為重要。
在蛋白質(zhì)相互作用網(wǎng)絡(luò)中,通常可以假定相互作用是沒有方向的。而實(shí)際上,在信號轉(zhuǎn)導(dǎo)、轉(zhuǎn)錄調(diào)控、細(xì)胞循環(huán)或者代謝途徑等多種生物網(wǎng)絡(luò)中,發(fā)生相互作用的蛋白質(zhì)之間廣泛存在著調(diào)控關(guān)系,例如:激活和抑制。然而,僅有少數(shù)蛋白質(zhì)相互作用被深入研究,而大部分相互作用的細(xì)節(jié)還是未知的,尤其是它們之間的調(diào)控關(guān)系還未被揭示。
用于蛋白質(zhì)之間調(diào)控關(guān)系的實(shí)驗(yàn)技術(shù)主要是基因上位分析(Genetic?epistasis?analysis),其主要是通過比較單個(gè)基因敲除以及兩個(gè)基因共同敲除時(shí)的不同表型來確定基因的功能關(guān)聯(lián)。相關(guān)技術(shù)中提出了一種利用基因擾動(dòng)實(shí)驗(yàn)發(fā)現(xiàn)蛋白質(zhì)之間調(diào)控關(guān)系的技術(shù)方案,該技術(shù)方案主要公開了如下技術(shù)內(nèi)容:
第一步、對于T細(xì)胞中的信號通路,采用流式細(xì)胞術(shù)計(jì)算正常情況下細(xì)胞中各蛋白質(zhì)的數(shù)目;
第二步、對通路中的單個(gè)蛋白質(zhì)依次進(jìn)行擾動(dòng)實(shí)驗(yàn),即對其進(jìn)行抑制處理,采用流式細(xì)胞術(shù)計(jì)算擾動(dòng)情況下各蛋白質(zhì)的數(shù)目;
第三步、根據(jù)受擾動(dòng)時(shí)蛋白質(zhì)數(shù)量上的變化,采用貝葉斯模型預(yù)測蛋白質(zhì)之間的調(diào)控關(guān)系;
第四步、將預(yù)測模型與實(shí)際模型進(jìn)行比較,評估預(yù)測效果。
然而,相關(guān)技術(shù)中提供的技術(shù)方案存在如下缺陷:基于生物學(xué)實(shí)驗(yàn)數(shù)據(jù)分析蛋白質(zhì)對之間的調(diào)控關(guān)系,需要花費(fèi)大量的人力、物力和財(cái)力,其結(jié)果容易出現(xiàn)錯(cuò)誤,而且難以進(jìn)行大規(guī)模的蛋白質(zhì)相互作用調(diào)控關(guān)系的預(yù)測。
發(fā)明內(nèi)容
本發(fā)明提供了一種分類模型的建立方法和裝置,以至少解決相關(guān)技術(shù)中的基于生物學(xué)實(shí)驗(yàn)數(shù)據(jù)分析蛋白質(zhì)對之間的調(diào)控關(guān)系花費(fèi)代價(jià)高、準(zhǔn)確性較低的問題。
根據(jù)本發(fā)明的一個(gè)方面,提供了一種分類模型的建立方法。
根據(jù)本發(fā)明的分類模型的建立方法包括:建立蛋白質(zhì)對之間調(diào)控關(guān)系的標(biāo)準(zhǔn)數(shù)據(jù)集,在標(biāo)準(zhǔn)數(shù)據(jù)集中構(gòu)建蛋白質(zhì)對中所包含的一個(gè)或多個(gè)結(jié)構(gòu)域之間的相互作用數(shù)據(jù)集;按照激活和/或抑制調(diào)控關(guān)系對標(biāo)準(zhǔn)數(shù)據(jù)集進(jìn)行分類;分別對相互作用數(shù)據(jù)集在每種分類中進(jìn)行富集顯著性分析,并根據(jù)分析結(jié)果建立分類模型。
優(yōu)選地,在標(biāo)準(zhǔn)數(shù)據(jù)集中構(gòu)建蛋白質(zhì)對中所包含的一個(gè)或多個(gè)結(jié)構(gòu)域之間的相互作用數(shù)據(jù)集包括:從蛋白質(zhì)對中提取每個(gè)蛋白質(zhì)所包含的一個(gè)或多個(gè)結(jié)構(gòu)域;對每個(gè)蛋白質(zhì)所包含的一個(gè)或多個(gè)結(jié)構(gòu)域之間的相互作用進(jìn)行匹配,構(gòu)建相互作用數(shù)據(jù)集。
優(yōu)選地,分別對相互作用數(shù)據(jù)集在每種分類中進(jìn)行富集顯著性分析,并根據(jù)分析結(jié)果建立分類模型包括:分別計(jì)算相互作用數(shù)據(jù)集在每種分類中的顯著性富集打分和顯著性P值;將顯著性P值小于預(yù)設(shè)閾值的部分相互作用數(shù)據(jù)集作為分類特征以及將顯著性富集打分作為權(quán)重建立分類模型。
優(yōu)選地,在分別對相互作用數(shù)據(jù)集在每種分類中進(jìn)行富集顯著性分析,并根據(jù)分析結(jié)果建立分類模型之后,還包括:采用交叉驗(yàn)證方法或者獨(dú)立測試集對分類模型的分類結(jié)果進(jìn)行評估。
優(yōu)選地,分類模型包括以下之一:帶有權(quán)重的投票法、線性分類器、支持向量機(jī)方法、決策樹方法。
根據(jù)本發(fā)明的另一方面,提供了一種分類模型的建立裝置。
根據(jù)本發(fā)明的分類模型的建立裝置包括:構(gòu)建模塊,用于建立蛋白質(zhì)對之間調(diào)控關(guān)系的標(biāo)準(zhǔn)數(shù)據(jù)集,在標(biāo)準(zhǔn)數(shù)據(jù)集中構(gòu)建蛋白質(zhì)對中所包含的一個(gè)或多個(gè)結(jié)構(gòu)域之間的相互作用數(shù)據(jù)集;分類模塊,用于按照激活和/或抑制調(diào)控關(guān)系對標(biāo)準(zhǔn)數(shù)據(jù)集進(jìn)行分類;建立模塊,用于分別對相互作用數(shù)據(jù)集在每種分類中進(jìn)行富集顯著性分析,并根據(jù)分析結(jié)果建立分類模型。
優(yōu)選地,構(gòu)建模塊包括:提取單元,用于從蛋白質(zhì)對中提取每個(gè)蛋白質(zhì)所包含的一個(gè)或多個(gè)結(jié)構(gòu)域;構(gòu)建單元,用于對每個(gè)蛋白質(zhì)所包含的一個(gè)或多個(gè)結(jié)構(gòu)域之間的相互作用進(jìn)行匹配,構(gòu)建相互作用數(shù)據(jù)集。
優(yōu)選地,建立模塊包括:計(jì)算單元,用于分別計(jì)算相互作用數(shù)據(jù)集在每種分類中的顯著性富集打分和顯著性P值;建立單元,用于將顯著性P值小于預(yù)設(shè)閾值的部分相互作用數(shù)據(jù)集作為分類特征以及將顯著性富集打分作為權(quán)重建立分類模型。
優(yōu)選地,上述裝置還包括:評估模塊,用于采用交叉驗(yàn)證方法或者獨(dú)立測試集對分類模型的分類結(jié)果進(jìn)行評估。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于中國人民解放軍國防科學(xué)技術(shù)大學(xué),未經(jīng)中國人民解放軍國防科學(xué)技術(shù)大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201310279561.5/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06F 電數(shù)字?jǐn)?shù)據(jù)處理
G06F19-00 專門適用于特定應(yīng)用的數(shù)字計(jì)算或數(shù)據(jù)處理的設(shè)備或方法
G06F19-10 .生物信息學(xué),即計(jì)算分子生物學(xué)中的遺傳或蛋白質(zhì)相關(guān)的數(shù)據(jù)處理方法或系統(tǒng)
G06F19-12 ..用于系統(tǒng)生物學(xué)的建模或仿真,例如:概率模型或動(dòng)態(tài)模型,遺傳基因管理網(wǎng)絡(luò),蛋白質(zhì)交互作用網(wǎng)絡(luò)或新陳代謝作用網(wǎng)絡(luò)
G06F19-14 ..用于發(fā)展或進(jìn)化的,例如:進(jìn)化的保存區(qū)域決定或進(jìn)化樹結(jié)構(gòu)
G06F19-16 ..用于分子結(jié)構(gòu)的,例如:結(jié)構(gòu)排序,結(jié)構(gòu)或功能關(guān)系,蛋白質(zhì)折疊,結(jié)構(gòu)域拓?fù)洌媒Y(jié)構(gòu)數(shù)據(jù)的藥靶,涉及二維或三維結(jié)構(gòu)的
G06F19-18 ..用于功能性基因組學(xué)或蛋白質(zhì)組學(xué)的,例如:基因型–表型關(guān)聯(lián),不均衡連接,種群遺傳學(xué),結(jié)合位置鑒定,變異發(fā)生,基因型或染色體組的注釋,蛋白質(zhì)相互作用或蛋白質(zhì)核酸的相互作用
- 一種數(shù)據(jù)庫讀寫分離的方法和裝置
- 一種手機(jī)動(dòng)漫人物及背景創(chuàng)作方法
- 一種通訊綜合測試終端的測試方法
- 一種服裝用人體測量基準(zhǔn)點(diǎn)的獲取方法
- 系統(tǒng)升級方法及裝置
- 用于虛擬和接口方法調(diào)用的裝置和方法
- 線程狀態(tài)監(jiān)控方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)
- 一種JAVA智能卡及其虛擬機(jī)組件優(yōu)化方法
- 檢測程序中方法耗時(shí)的方法、裝置及存儲(chǔ)介質(zhì)
- 函數(shù)的執(zhí)行方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)





