[發明專利]一種基因序列數據分析與在線交互可視化的方法在審
| 申請號: | 201710607539.7 | 申請日: | 2017-07-24 |
| 公開(公告)號: | CN107451422A | 公開(公告)日: | 2017-12-08 |
| 發明(設計)人: | 楊文婷 | 申請(專利權)人: | 楊文婷 |
| 主分類號: | G06F19/18 | 分類號: | G06F19/18;G06F19/26 |
| 代理公司: | 北京文苑專利代理有限公司11516 | 代理人: | 王煒 |
| 地址: | 225000 江蘇省揚州*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基因 序列 數據 分析 在線 交互 可視化 方法 | ||
技術領域
本發明屬于基因序列分析技術領域,具體涉及一種基因序列數據分析與在線交互可視化的方法。
背景技術
隨著二代測序技術的成熟和完善,基因組測序在生物醫學研究領域得到了廣泛應用。以在腫瘤的基礎研究和臨床應用領域為例,研究人員可以利用不同來源的腫瘤組織或樣本進行腫瘤發生及轉移的機制研究、篩查腫瘤早期診斷或復發的標志物,或者結合臨床數據,評估不同治療方案下的早期治療好壞、探索不同病人預后好壞的機制。
基因具有多樣的突變特性,包括單核苷酸突變(SNV)、多核苷酸突變(MNV)、插入、缺失和復雜突變,以及更復雜的結構突變(SV),例如重復(DUP)、反轉(INVs)、插入和易位。與癌癥有關的基因如KRAS,NRAS,BRAF和EGFR通常包含錯位突變。目前有很多分析和定位基因突變位點的算法和工具,如GATK開發的工具之一,UnifiedGenotyper,它是集合多種變異檢測方法而成的一種突變檢測工具,既可以用于單個樣本的變異檢測,也可以用于群體的變異檢測。UnifiedGenotyper使用貝葉斯最大似然模型,同時估計基因型和基因頻率,最后對每一個樣本的每一個變異位點和基因型都會給出一個精確的后驗概率。
現有的基因序列分析技術,是將一組基因序列數據比對之后進行目標區域突變檢測,得到vcf格式的突變結果文件,對其進行各種注釋,包括人群數據庫頻率注釋,疾病數據庫、變異危害度預測等等。完成之后,再進行分析與預測,如腫瘤體細胞突變分析、體細胞突變頻率及突變頻譜圖、體細胞突變總覽圖、體細胞突變circos展示圖、突變位點分布情況分析圖、體細胞突變富集分析、腫瘤已知驅動基因突變檢測、腫瘤驅動基因預測,等等。最后,將結果以表格和統計圖的形式進行可視化展示。
許多已有的定位基因突變位點的算法和工具,如GATK,FreeBayes和VarScan等等只能用來分別定位單核苷酸突變和局部的插入和缺失突變,但當這些突變組合在一起時,則不能夠準確解決定位和統計基因突變數。此外,TP53,PTEN,BRCA1/2,RB1,STK11和NF1等腫瘤上皮抑制因子通常含有大的基因片段插入和缺失突變或復雜的突變,有時甚至是結構性的突變,這些突變經常被上述算法工具遺漏。為了更全面地分析癌癥基因組,需要能夠識別所有這些不同類型突變的檢測工具。此外,超臨界測序越來越多地應用于臨床環境中,它對于低等位基因頻率突變的檢測具有更強大的優勢。常見的突變檢測方法會隨著覆蓋深度的增加而計算性能弱化,通常會采取降采樣(隨機刪除數據部分)的方法來提高它的計算性能。然而,降采樣會顯著降低檢測低等位基因頻率突變的敏感性??紤]到等位基因頻率突變的隨機性,在這種情況下采用降采樣會遺漏很多信息。
另外,現有的突變檢測方法和工具還存在下列局限性:
1.對等位基因頻率的插入和缺失突變數量估計偏低;
2.不能檢測較大的復雜的插入和缺失突變;
3.在非降采樣的情況下,不能根據計算性能對深度覆蓋進行有效評估。
目前對于分析結果的展示,只能靜態地從一個角度來展示分析結果,當用戶需要多角度分析一批基因序列數據的信息價值時,會十分不方便。以分析某種基因突變分布與性別、年齡的關系為例,用戶需要先選中男性的基因序列數據進行分析,得到結果,再選中女性的基因序列數據進行分析并得到結果,二者對比來獲得結論;然后,用戶需要再選中不同年齡段人群的基因序列數據分別分析完成后再對比,才能獲得結論。這樣做的過程中,存在以下兩方面的不足:一方面,同一個基因序列數據可能被重復分析了很多次,而分析一個基因序列樣本往往需要幾個小時,浪費了大量時間和分析資源;另一方面,操作不連續,非常不便于用戶分析數據,當從多個角度分析時,用戶需要不斷重復選擇數據-分析-選擇數據-分析的循環,每次分析完成之后都要回到電腦前重新選擇數據進行新一次的分析,而分析的過程又非常花時間,十分不方便。
發明內容
針對上述現有技術中存在的問題,本發明的目的在于提供一種可避免出現上述技術缺陷的基因序列數據分析與在線交互可視化的方法。
為了實現上述發明目的,本發明提供的技術方案如下:
一種基因序列數據分析與在線交互可視化的方法,包括以下步驟:
步驟1)上傳基因序列數據,填寫對應信息;
步驟2)選擇基因序列數據,進行單基因序列數據分析;
步驟3)選擇多個單基因序列數據的分析結果,進行組合分析;
步驟4)查看組合分析的結果,導出報告;
步驟5)對分析結果進行可視化展示。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于楊文婷,未經楊文婷許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710607539.7/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種小口徑管道收口機管道平移夾持工裝
- 下一篇:一種模具加工機械用縮口機
- 同類專利
- 專利分類
G06F 電數字數據處理
G06F19-00 專門適用于特定應用的數字計算或數據處理的設備或方法
G06F19-10 .生物信息學,即計算分子生物學中的遺傳或蛋白質相關的數據處理方法或系統
G06F19-12 ..用于系統生物學的建?;蚍抡?,例如:概率模型或動態模型,遺傳基因管理網絡,蛋白質交互作用網絡或新陳代謝作用網絡
G06F19-14 ..用于發展或進化的,例如:進化的保存區域決定或進化樹結構
G06F19-16 ..用于分子結構的,例如:結構排序,結構或功能關系,蛋白質折疊,結構域拓撲,用結構數據的藥靶,涉及二維或三維結構的
G06F19-18 ..用于功能性基因組學或蛋白質組學的,例如:基因型–表型關聯,不均衡連接,種群遺傳學,結合位置鑒定,變異發生,基因型或染色體組的注釋,蛋白質相互作用或蛋白質核酸的相互作用
- 數據顯示系統、數據中繼設備、數據中繼方法、數據系統、接收設備和數據讀取方法
- 數據記錄方法、數據記錄裝置、數據記錄媒體、數據重播方法和數據重播裝置
- 數據發送方法、數據發送系統、數據發送裝置以及數據結構
- 數據顯示系統、數據中繼設備、數據中繼方法及數據系統
- 數據嵌入裝置、數據嵌入方法、數據提取裝置及數據提取方法
- 數據管理裝置、數據編輯裝置、數據閱覽裝置、數據管理方法、數據編輯方法以及數據閱覽方法
- 數據發送和數據接收設備、數據發送和數據接收方法
- 數據發送裝置、數據接收裝置、數據收發系統、數據發送方法、數據接收方法和數據收發方法
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置





