[發明專利]通過模塊化選擇實現的生物信息項目自動分析方法及系統有效
| 申請號: | 201410742403.3 | 申請日: | 2014-12-08 |
| 公開(公告)號: | CN104484582B | 公開(公告)日: | 2018-04-24 |
| 發明(設計)人: | 蘇海橋;蔡雄穎;唐啟覃;李卡麟;鄭媛;周良風;梁紹光;陳勇;劉娜;李國慶 | 申請(專利權)人: | 深圳華大基因科技服務有限公司 |
| 主分類號: | G06F19/10 | 分類號: | G06F19/10 |
| 代理公司: | 廣州三環專利商標代理有限公司44202 | 代理人: | 梁順宜,郝傳鑫 |
| 地址: | 518083 廣東省深圳市*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 通過 模塊化 選擇 實現 生物 信息 項目 自動 分析 方法 系統 | ||
1.一種通過模塊化選擇實現的生物信息項目自動分析方法,其特征在于,包括步驟:
步驟一:創建項目并存于業務管理系統中,每個項目包括多個子項目;并由用戶根據子項目和任務信息直接選擇所述創建項目中需要的分析模塊;所述子項目的類型包括只過濾子項目和標準化子項目;
步驟二:當所述子項目的類型為標準化子項目時,則該子項目對應的樣品在經測序儀測序的同時,供用戶選擇對該樣品創建包括過濾分析、表達譜定量分析、差異比較分析、Cluster聚類分析、靶基因預測分析、KOGO分析和堿基編輯分析中的一種或多種的模塊化的標準流程分析,且在創建每個標準流程分析過程中由用戶根據當前子項目的樣品情況、測序類型、分析目的選擇匹配的過濾模塊及輸入對應的比對參數;經測序儀測序完成后,根據所述過濾模塊及比對參數對每一樣品數據進行過濾,從而去掉不符合比對參數的樣品數據;然后再運用所創建的標準流程分析模塊對符合比對參數的每一樣品數據進行分析,從而生成分析結果,分析結果包括子項目信息和對應的樣品信息;
當所述子項目的類型為只過濾子項目,則根據選擇的子項目類型和任務信息,依次從下機數據管理系統中獲取對應的且經過測序儀測序后的樣品數據;且每獲取一個樣品數據,即根據預設的參數配置運用統一的過濾標準進行過濾與分析,從而過濾不符合參數配置的樣品數據;且待獲取的所有樣品數據過濾與分析完后,生成分析結果,分析結果包括子項目信息和對應的樣品信息;
步驟三:由用戶選擇質控模塊以及輸入對應的質控參數來對所述分析結果進行質控,若質控通過,則直接輸出該分析結果;若質控不通過,且所述分析結果和質控標準的差距在閾值范圍內,則重新編輯所述樣品數據或過濾/質控參數后再次進行步驟二的過濾與分析過程,直至分析結果通過質控;若質控不通過,且所述分析結果和質控標準的差距超過閾值,則編輯所述樣品且廢棄相關Lane,并在所述業務管理系統中重新下單。
2.如權利要求1所述的通過模塊化選擇實現的生物信息項目自動分析方法,其特征在于,每個子項目的概要信息包括子項目代碼、子項目名稱、子項目類型、是否是只過濾、總的樣品數、執行人、開始時間和結束時間、子項目狀態以及子項目相關操作;所述樣品信息包括樣品名稱、文庫名稱、Lane ID、測序策略、Flowcell ID、Raw data、Raw Reads、Read Length、GC%、Q20%、Q30%、Error Rate、堿基分布圖以及堿基質控分布圖。
3.如權利要求1所述的通過模塊化選擇實現的生物信息項目自動分析方法,其特征在于,還包括步驟:將所述分析結果進行存儲備份;而優選在所述步驟三中:若質控不通過且所述分析結果和質控標準的差距在閾值范圍內,則重新編輯所述樣品數據是可以單個樣品數據編輯或樣品批量編輯。
4.如權利要求1所述的通過模塊化選擇實現的生物信息項目自動分析方法,其特征在于,所述比對參數存于數據庫中;該數據庫為公共數據庫或個人數據庫,在創建每個標準流程分析過程中由用戶在所述個人數據庫中選擇建立新的數據庫記錄以及根據當前子項目的樣品情況、測序類型、分析目的向所述新的數據庫記錄中輸入對應的所述比對參數。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于深圳華大基因科技服務有限公司,未經深圳華大基因科技服務有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201410742403.3/1.html,轉載請聲明來源鉆瓜專利網。
- 同類專利
- 專利分類
G06F 電數字數據處理
G06F19-00 專門適用于特定應用的數字計算或數據處理的設備或方法
G06F19-10 .生物信息學,即計算分子生物學中的遺傳或蛋白質相關的數據處理方法或系統
G06F19-12 ..用于系統生物學的建模或仿真,例如:概率模型或動態模型,遺傳基因管理網絡,蛋白質交互作用網絡或新陳代謝作用網絡
G06F19-14 ..用于發展或進化的,例如:進化的保存區域決定或進化樹結構
G06F19-16 ..用于分子結構的,例如:結構排序,結構或功能關系,蛋白質折疊,結構域拓撲,用結構數據的藥靶,涉及二維或三維結構的
G06F19-18 ..用于功能性基因組學或蛋白質組學的,例如:基因型–表型關聯,不均衡連接,種群遺傳學,結合位置鑒定,變異發生,基因型或染色體組的注釋,蛋白質相互作用或蛋白質核酸的相互作用





