[發明專利]用于分析基因的方法及裝置有效
| 申請號: | 201580078100.9 | 申請日: | 2015-11-30 |
| 公開(公告)號: | CN107408162B | 公開(公告)日: | 2020-12-01 |
| 發明(設計)人: | 樸熊洋;慎玹銳;金奈映 | 申請(專利權)人: | 吉尼努斯公司 |
| 主分類號: | G16B30/00 | 分類號: | G16B30/00;G16B20/00 |
| 代理公司: | 北京市中倫律師事務所 11410 | 代理人: | 石寶忠 |
| 地址: | 韓國*** | 國省代碼: | 暫無信息 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 用于 分析 基因 方法 裝置 | ||
用于分析基因的方法及裝置,其通過從受檢樣品的下一代測序(NGS)數據中獲取關于讀段的數據,并且利用該讀段提取受檢樣品的有可能存在染色體內易位(translocation)的候選基因對,從而在候選基因對中識別易位基因。
技術領域
本發明涉及一種用于分析基因的方法及裝置,特別是,涉及一種用于分析關于易位(translocation)基因的數據的方法及裝置。
背景技術
基因組(genome)是指某一生物所具有的所有基因信息。為了某一個體基因組的測序(sequencing),正在開發DNA芯片及下一代測序(Next Generation Sequencing)技術或下下一代測序(Next Next Generation Sequencing)技術等多種技術。為了尋找表達如糖尿病或癌癥等疾病的基因或者識別遺傳多樣性與個體表達特性之間的相關關系等,廣泛應用如核酸序列或蛋白質等的基因信息的分析。特別是,從查明彼此不同的癥狀或與疾病進展相關聯的個體遺傳特征的方面來看,從個體中收集到的遺傳數據很重要。因此,如個體的核酸序列或蛋白質等的遺傳數據為允許通過識別當前及未來的疾病關聯信息來預防疾病或在疾病的初期步驟中選擇最佳治療方法的核心數據。近年來,雖然因測序技術的發展而試圖發掘多種結構變異(structure variation),但仍然產生相當量的假陽性(falsepositive)或假陰性(false negative)的結果,其反證仍然有較多的生物信息學(bioinformatics)上的挑戰性因素。
發明內容
本發明提供一種用于分析基因的方法及裝置。本實施例所要解決的技術問題并非由如上所述的技術問題來限定,能夠從以下實施例中類推出又一技術問題。
根據一方面,用于分析基因的方法包括以下步驟:從受檢樣品的下一代測序(NGS)數據中獲取關于斷裂讀段(split reads)及比對不一致(discordantly)的PE(paired-end,雙端)讀段的數據;利用所述斷裂讀段和所述PE讀段來提取所述受檢樣品的有可能存在染色體內易位(translocation)的第一候選基因對;以及以所述斷裂讀段所呈現的斷點(break points)和所述第一候選基因對的融合(fusion)方向為基礎,在所述第一候選基因對中識別易位基因。
此外,所述識別包括:在所提取的第一候選基因對中提取第二候選基因對,所述第二候選基因對包含與具有屬于相同的覆蓋度的斷點的多個斷裂讀段進行比對的基因,其中從所提取的第二候選基因對中識別出所述易位基因。
此外,關于包含在所提取的第二候選基因對中的所述基因,具有屬于所述相同的覆蓋度的所述斷點的所述斷裂讀段的個數為規定臨界值以上。
此外,所述識別包括:在所提取的第二候選基因對中提取彼此不同的基因之間的所述融合方向為從5’端(end)到3’端或從3’端到5’端的第三候選基因對,其中從所提取的第二候選基因對中識別出所述易位基因。
此外,所述NGS數據包括BAM(二進制序列比對/映射,binary version of SAM)格式數據或SAM(序列比對/映射,Sequence Alignment/Map)格式數據。
此外,所述獲取步驟從所述BAM格式數據或所述SAM格式數據中獲取關于每個所述斷裂讀段和每個所述PE讀段的FLAG(位標識)及CIGAR(Compact Idiosyncratic GappedAlignment Report,簡要比對信息表達式)字符串的數據。
此外,通過用于在所述受檢樣品中識別靶向基因的堿基序列的靶向測序(targeted sequencing)來生成所述NGS數據。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于吉尼努斯公司,未經吉尼努斯公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201580078100.9/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:用于治療疾病和病癥的組合物和方法
- 下一篇:電力變換裝置以及熱泵裝置





