[發明專利]利用TCGA數據庫資源發現直腸癌相關microRNA分子標志物的方法及系統和應用有效
| 申請號: | 201710037974.0 | 申請日: | 2017-01-19 |
| 公開(公告)號: | CN106845104B | 公開(公告)日: | 2019-04-09 |
| 發明(設計)人: | 陳瑞;高娜;李曉波;孟慶濤;吳申申 | 申請(專利權)人: | 東南大學 |
| 主分類號: | G16H50/70 | 分類號: | G16H50/70;G16B40/00;G16B50/00 |
| 代理公司: | 南京瑞弘專利商標事務所(普通合伙) 32249 | 代理人: | 陳國強 |
| 地址: | 211189 江*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 利用 tcga 數據庫 資源 發現 直腸癌 相關 microrna 分子 標志 方法 系統 應用 | ||
1.一種利用TCGA數據庫資源發現直腸癌相關microRNA分子標志物的系統,其特征在于:所述系統包括:
樣本數據下載和整理模塊,用于獲取miRNA表達數據,包含疾病樣本和對應的正常樣本;
差異表達分析模塊,用于對miRNA數據進行表達分析,統計差異顯著性,此過程需排除零值等極值影響;
篩選排名模塊,用于將差異表達的miRNA按照差異倍數絕對值排序,越大的排名越靠前,篩選一定數目的miRNA作為待研究miRNA;
選定靶基因模塊,用于應用miRWalk、TargetScan等靶基因預測網站或軟件作為預測miRNA靶基因的工具,獲取靶基因;
功能分析模塊,用于根據選中的mRNA,采用DAVID數據庫信息進行基因本體分析,代謝通路分析和疾病相關分析并圖形化展示;
該系統通過以下步驟實現發現直腸癌相關miRNA:
步驟1,樣本數據下載和整理:獲取miRNA表達數據,選定目標疾病直腸癌和測序平臺,下載數據,數據包含疾病樣本和對應的正常樣本;具體為:
步驟1.1,進入R語言工作界面,載入TCGAbiolinks包;
步驟1.2,在TCGA數據庫設定目標疾病直腸癌、測序平臺和miRNA文件類型;
步驟1.3,批量下載所需的標準化數據;
步驟1.4,將上述步驟得到的數據進行合并,并去除極值,得到理論上有效的miRNA表達值;所述極值數據是作為RNA表達值的標準化測序片段數目為零的數據;
步驟2,對步驟1得到的miRNA表達數據的差異表達分析;其中,差異表達分析選取1.5倍或者2倍的差異倍數,選用三個標準Benjamini–Hochberg方法、FDR方法或者Bonforroni方法校正
步驟3,將經過步驟2處理后的miRNA表達數據按照變化幅度排序,變化率越大的排名越靠前,篩選排名靠前的10個miRNA表達數據作為相關miRNA表達數據;
步驟4,應用靶基因預測網站或軟件作為預測miRNA靶基因的工具,獲取靶基因;其中,預測靶基因采用靶基因預測網站中已有數據資源整合和軟件預測算法兩種方式,需遵循預選基因至少被兩個以上預測算法或數據庫同時預測到;
所述的靶基因預測網站是miRWalk數據庫和TargetScan;
所述的預測軟件是TargetScan和miRanda;
步驟5,對靶基因進行功能分析并找出與疾病相關的條目,構建網絡示意圖;其中,所述的對mRNA的功能性分析基于DAVID數據庫信息,包括基因本體分析,代謝通路分析,疾病相關分析和調控網絡的構建;
所述的基因本體分析采用DAVID數據庫信息從生物過程、分子功能和細胞組分三個成分進行注釋和富集分析;
所述的代謝通路分析采用DAVID數據庫信息包含的KEGG、Reactome數據庫信息進行分析;
所述的疾病相關分析采用DAVID數據庫信息包含的GAD_DISEASE、GAD_DISEASE_CLASS和OMIM_DISEASE數據庫信息進行分析。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于東南大學,未經東南大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710037974.0/1.html,轉載請聲明來源鉆瓜專利網。





