[發(fā)明專利]一種多組學(xué)數(shù)據(jù)集間關(guān)聯(lián)分析的集成系統(tǒng)和方法在審
| 申請(qǐng)?zhí)枺?/td> | 202010694533.X | 申請(qǐng)日: | 2020-07-17 |
| 公開(公告)號(hào): | CN111863136A | 公開(公告)日: | 2020-10-30 |
| 發(fā)明(設(shè)計(jì))人: | 賈偉;陳天璐;梁丹丹;孫濤 | 申請(qǐng)(專利權(quán))人: | 上海市第六人民醫(yī)院 |
| 主分類號(hào): | G16B40/00 | 分類號(hào): | G16B40/00;G16B45/00;G16B50/00 |
| 代理公司: | 上海申新律師事務(wù)所 31272 | 代理人: | 吳軼淳 |
| 地址: | 200233 *** | 國(guó)省代碼: | 上海;31 |
| 權(quán)利要求書: | 查看更多 | 說(shuō)明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 多組學(xué) 數(shù)據(jù) 關(guān)聯(lián) 分析 集成 系統(tǒng) 方法 | ||
本發(fā)明提供一種多組學(xué)數(shù)據(jù)集間關(guān)聯(lián)分析的集成系統(tǒng)和方法,對(duì)每一種類型的組學(xué)原始數(shù)據(jù)進(jìn)行處理得到與組學(xué)原始數(shù)據(jù)的類型對(duì)應(yīng)的組學(xué)數(shù)據(jù)文件,對(duì)表型原始數(shù)據(jù)并處理得到表型數(shù)據(jù)文件;將多種類型的組學(xué)數(shù)據(jù)文件的組學(xué)變量中的兩類組學(xué)變量加入一變量集合,并將變量集合中的各個(gè)組學(xué)變量進(jìn)行兩兩組合生成多個(gè)組學(xué)單維數(shù)據(jù)對(duì);將每一種類型的組學(xué)數(shù)據(jù)文件進(jìn)行降維處理得到與該種類型相對(duì)應(yīng)的組合變量;將多種類型的組合變量進(jìn)行兩兩組合生成多個(gè)組合變量數(shù)據(jù)對(duì);將多種類型的組合變量分別與表型數(shù)據(jù)文件進(jìn)行兩兩組合生成多個(gè)組學(xué)與表型數(shù)據(jù)對(duì);對(duì)各組學(xué)單維數(shù)據(jù)對(duì)、組合變量數(shù)據(jù)對(duì)、組學(xué)與表型數(shù)據(jù)對(duì)進(jìn)行相關(guān)分析分別得到各自的相關(guān)關(guān)系和對(duì)應(yīng)的相關(guān)性參數(shù)并輸出。為全面解析系統(tǒng)生物學(xué)信息提供了有效的方法,不僅能發(fā)現(xiàn)多組學(xué)數(shù)據(jù)間的線性相關(guān)關(guān)系,還能找出包括具有函數(shù)關(guān)系和無(wú)函數(shù)關(guān)系的非線性的相關(guān)對(duì),具有全面的功能性。
技術(shù)領(lǐng)域
本發(fā)明涉及生物學(xué)多組學(xué)計(jì)算分析領(lǐng)域,尤其涉及一種多組學(xué)數(shù)據(jù)集間關(guān)聯(lián)分析的集成系統(tǒng)和方法。
背景技術(shù)
代謝物組、微生物組、轉(zhuǎn)錄組、蛋白質(zhì)組以及基因組等多種層次和來(lái)源的高通量組學(xué)數(shù)據(jù)體量龐大且數(shù)據(jù)結(jié)構(gòu)多樣,變量間以及變量與表型間關(guān)系錯(cuò)綜復(fù)雜。通過整合多組學(xué)和表型數(shù)據(jù),有助于在大量復(fù)雜的多組學(xué)數(shù)據(jù)間或組學(xué)與表型數(shù)據(jù)間找到有效關(guān)聯(lián)對(duì),揭示組分間或組分與表型間的相互作用和關(guān)系,是轉(zhuǎn)化醫(yī)學(xué)和系統(tǒng)生物學(xué)研究中常用手段之一。但由于多組學(xué)數(shù)據(jù)的來(lái)源、結(jié)構(gòu)和特征各不相同,故需科學(xué)選取相關(guān)分析方法以及建立高度自動(dòng)化、分析結(jié)果可靠的關(guān)聯(lián)分析集成系統(tǒng)進(jìn)行多組學(xué)研究。
近年來(lái)多組學(xué)聯(lián)合分析已經(jīng)成為研究熱點(diǎn),各種組學(xué)間的相關(guān)分析方法也相繼被提出。其中經(jīng)典的相關(guān)分析方法包括Pearson積相關(guān)、Spearman秩相關(guān)、線性回歸分析、典型相關(guān)分析等。而具有廣泛性的最大信息系數(shù)法適用于分析各種類型的數(shù)據(jù)集,且可發(fā)現(xiàn)數(shù)據(jù)間存在的各種復(fù)雜相關(guān)關(guān)系,包括線性相關(guān)和非線性相關(guān)關(guān)系、函數(shù)相關(guān)和非函數(shù)相關(guān)關(guān)系。還有如SparCC和CCLasso是針對(duì)組分?jǐn)?shù)據(jù)內(nèi)部變量的相關(guān)性研究而提出的專門方法,相較于常規(guī)相關(guān)分析法能更精準(zhǔn)的在該類數(shù)據(jù)集中找到相關(guān)對(duì)。另外,當(dāng)前的多組學(xué)聯(lián)合分析由于多組學(xué)數(shù)據(jù)量龐大且結(jié)構(gòu)復(fù)雜,導(dǎo)致不易篩選單個(gè)生物標(biāo)志物,而且這些分析策略大都局限于組學(xué)數(shù)據(jù)間的相關(guān)性,忽略了表型特征在多組學(xué)聯(lián)合分析中的指導(dǎo)作用,也沒有考慮生物學(xué)問題中普遍存在的協(xié)變量的影響,其結(jié)果的準(zhǔn)確性和真實(shí)性有待提高。
發(fā)明內(nèi)容
針對(duì)現(xiàn)有技術(shù)中存在的問題,提供一種多組學(xué)數(shù)據(jù)集間關(guān)聯(lián)分析的集成系統(tǒng)和方法。
一種多組學(xué)數(shù)據(jù)集間關(guān)聯(lián)分析的集成系統(tǒng),包括一服務(wù)器,服務(wù)器連接一多組學(xué)與表型數(shù)據(jù)庫(kù),多組學(xué)與表型數(shù)據(jù)庫(kù)用于保存多種類型的組學(xué)原始數(shù)據(jù)、表型原始數(shù)據(jù)和對(duì)應(yīng)的協(xié)變量數(shù)據(jù);服務(wù)器具體包括:
數(shù)據(jù)處理模塊,用于對(duì)每一種類型的組學(xué)原始數(shù)據(jù)進(jìn)行處理得到與組學(xué)原始數(shù)據(jù)的類型對(duì)應(yīng)的組學(xué)數(shù)據(jù)文件,每一種類型的組學(xué)數(shù)據(jù)文件包括以行列式排布的多個(gè)相應(yīng)的組學(xué)變量;用于獲取表型原始數(shù)據(jù)并處理得到表型數(shù)據(jù)文件,表型數(shù)據(jù)文件包括以行列形式排布的多個(gè)表型變量;
待分析數(shù)據(jù)生成模塊,與數(shù)據(jù)處理模塊連接,待分析數(shù)據(jù)生成模塊具體包括:
指令接收單元,用于接收外部輸入的組學(xué)單維相關(guān)分析指令、組學(xué)多維相關(guān)分析指令或組學(xué)與表型相關(guān)分析指令;
協(xié)變量判斷單元,與指令接收單元連接,用于判斷組學(xué)單維相關(guān)分析指令、組學(xué)多維相關(guān)分析指令或組學(xué)與表型相關(guān)分析指令是否有加載協(xié)變量;
組學(xué)單維數(shù)據(jù)對(duì)生成單元,連接指令接收單元,用于根據(jù)組學(xué)單維相關(guān)分析指令,將多種類型的組學(xué)數(shù)據(jù)文件的組學(xué)變量中的兩類組學(xué)變量加入一變量集合,并將變量集合中的各個(gè)組學(xué)變量進(jìn)行兩兩組合生成多個(gè)組學(xué)單維數(shù)據(jù)對(duì);
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于上海市第六人民醫(yī)院,未經(jīng)上海市第六人民醫(yī)院許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010694533.X/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 基于多組學(xué)豐度信息的蛋白質(zhì)二級(jí)質(zhì)譜鑒定方法
- 基于病例多組學(xué)變異特征的精準(zhǔn)醫(yī)學(xué)知識(shí)搜索系統(tǒng)及實(shí)現(xiàn)方法
- 一種多組學(xué)數(shù)據(jù)聯(lián)合分析的方法
- 一種從多組學(xué)數(shù)據(jù)中分析關(guān)聯(lián)變化模式的系統(tǒng)和方法
- 多組學(xué)數(shù)據(jù)擾動(dòng)云
- 基于D-S證據(jù)理論進(jìn)行多組學(xué)數(shù)據(jù)集成的癌癥亞型分類方法
- 一種非小細(xì)胞肺癌患者術(shù)后復(fù)發(fā)相關(guān)性因素研究方法
- 一種基于深度學(xué)習(xí)的多組學(xué)智能診斷系統(tǒng)
- 用于癌癥基因組和臨床數(shù)據(jù)綜合分析的多組學(xué)搜索引擎
- 單組學(xué)及多組學(xué)KEGG PATHWAY map表達(dá)熱圖個(gè)性化展示的方法及應(yīng)用
- 數(shù)據(jù)顯示系統(tǒng)、數(shù)據(jù)中繼設(shè)備、數(shù)據(jù)中繼方法、數(shù)據(jù)系統(tǒng)、接收設(shè)備和數(shù)據(jù)讀取方法
- 數(shù)據(jù)記錄方法、數(shù)據(jù)記錄裝置、數(shù)據(jù)記錄媒體、數(shù)據(jù)重播方法和數(shù)據(jù)重播裝置
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)發(fā)送系統(tǒng)、數(shù)據(jù)發(fā)送裝置以及數(shù)據(jù)結(jié)構(gòu)
- 數(shù)據(jù)顯示系統(tǒng)、數(shù)據(jù)中繼設(shè)備、數(shù)據(jù)中繼方法及數(shù)據(jù)系統(tǒng)
- 數(shù)據(jù)嵌入裝置、數(shù)據(jù)嵌入方法、數(shù)據(jù)提取裝置及數(shù)據(jù)提取方法
- 數(shù)據(jù)管理裝置、數(shù)據(jù)編輯裝置、數(shù)據(jù)閱覽裝置、數(shù)據(jù)管理方法、數(shù)據(jù)編輯方法以及數(shù)據(jù)閱覽方法
- 數(shù)據(jù)發(fā)送和數(shù)據(jù)接收設(shè)備、數(shù)據(jù)發(fā)送和數(shù)據(jù)接收方法
- 數(shù)據(jù)發(fā)送裝置、數(shù)據(jù)接收裝置、數(shù)據(jù)收發(fā)系統(tǒng)、數(shù)據(jù)發(fā)送方法、數(shù)據(jù)接收方法和數(shù)據(jù)收發(fā)方法
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)再現(xiàn)方法、數(shù)據(jù)發(fā)送裝置及數(shù)據(jù)再現(xiàn)裝置
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)再現(xiàn)方法、數(shù)據(jù)發(fā)送裝置及數(shù)據(jù)再現(xiàn)裝置
- 關(guān)聯(lián)裝置
- 數(shù)據(jù)關(guān)聯(lián)裝置和數(shù)據(jù)關(guān)聯(lián)方法
- 安全關(guān)聯(lián)
- 設(shè)備關(guān)聯(lián)
- 終端關(guān)聯(lián)裝置和終端關(guān)聯(lián)方法
- 關(guān)聯(lián)方法和關(guān)聯(lián)設(shè)備
- 關(guān)聯(lián)方法和關(guān)聯(lián)設(shè)備
- 關(guān)聯(lián)方法和關(guān)聯(lián)設(shè)備
- 關(guān)聯(lián)分析方法和關(guān)聯(lián)分析系統(tǒng)
- 報(bào)文關(guān)聯(lián)方法、報(bào)文關(guān)聯(lián)裝置及報(bào)文關(guān)聯(lián)系統(tǒng)





