[發(fā)明專利]人類基因突變的HGVS名稱生成及分析系統(tǒng)的實現(xiàn)方法有效
| 申請?zhí)枺?/td> | 201710298386.2 | 申請日: | 2017-05-01 |
| 公開(公告)號: | CN107122624B | 公開(公告)日: | 2021-11-12 |
| 發(fā)明(設(shè)計)人: | 楊永臣 | 申請(專利權(quán))人: | 楊永臣 |
| 主分類號: | G16B20/00 | 分類號: | G16B20/00 |
| 代理公司: | 上海天翔知識產(chǎn)權(quán)代理有限公司 31224 | 代理人: | 呂伴 |
| 地址: | 201802 上海市嘉定*** | 國省代碼: | 上海;31 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 人類 基因突變 hgvs 名稱 生成 分析 系統(tǒng) 實現(xiàn) 方法 | ||
1.一種基因突變的HGVS名稱自動生成的方法:其特征在于,包括如下步驟:
步驟一,先以特定格式描述基因上所發(fā)現(xiàn)的變異;
步驟二,將該格式輸入突變分析系統(tǒng),通過HGVS計算程序調(diào)用基因信息數(shù)據(jù)庫、基因遺傳方式數(shù)據(jù)庫、HGMD數(shù)據(jù)庫進行計算;
步驟三,獲得基因變異的HGVS名稱和基于HGVS名稱的相關(guān)信息;
所述突變分析系統(tǒng)還包括數(shù)據(jù)輸入界面、HGVS計算程序及數(shù)據(jù)輸出界面,在數(shù)據(jù)輸入界面,用戶需輸入:“gene(R/M)S z/c”,數(shù)據(jù)輸入界面支持輸入多行數(shù)據(jù)的分析;gene為基因名稱,R為變異位點參考序列,M為變異位點突變序列,S為變異位點之后一段序列,z代表變異位點是純合型,c代表變異位點是雜合型,z/c應(yīng)輸入單個字母,也可以不輸入;
所述HGVS計算程序可將輸入的信息轉(zhuǎn)化為HGVS名稱,HGVS計算程序可在生成的HGVS名稱后,通過該名稱從HGMD數(shù)據(jù)庫中調(diào)取與該突變有關(guān)的信息,這些信息包括:突變的致病性,突變導(dǎo)致的疾病,有關(guān)該突變的參考文獻;
HGVS計算程序計算后,將計算結(jié)果輸出到輸出界面,包括:突變基因,轉(zhuǎn)錄本,核苷酸變化,氨基酸變化,純合/雜合,遺傳方式,HGMD致病性, HGMD疾病,文獻;
HGVS名稱運算流程如下:
在數(shù)據(jù)輸入環(huán)節(jié),用戶應(yīng)輸入:“gene(R/M)S z/c”,在此格式中,gene是不可缺失的,且應(yīng)使用標(biāo)準(zhǔn)的基因名稱;R為變異位點參考序列,M為變異位點突變序列,R和M皆可以代表一個堿基,也可以代表多個堿基,R和M在堿基缺失時可以用“-”代替;堿基缺失時,M為“-”,堿基插入時,R為“-”,z/c代表堿基雜合型或純合型,通過峰圖即可簡單判斷,應(yīng)輸入單個字母,也可以不輸入;
對于所輸入的信息,HGVS運算程序根據(jù)括號中的斜杠兩邊的堿基數(shù)量、是否存在短杠“-”,以及括號后提供的序列在基因組序列中的情況來判斷突變型,根據(jù)括號后序列在基因組序列中的位置及突變類型來判斷突變在CDS坐標(biāo)上的位置,從而計算出HGVS名稱;
通過HGVS計算程序得到某基因某變異的HGVS名稱后,可從遵循了HGVS命名規(guī)則的變異數(shù)據(jù)庫中檢索該變異,找到后從數(shù)據(jù)庫中調(diào)取與該變異有關(guān)的信息;常用的人類基因變異數(shù)據(jù)庫包括ClinVar,HGMD,都遵循了HGVS突變命名規(guī)則;此處以HGMD為例,通過HGVS計算測序所得HGVS名稱,可對接HGMD專業(yè)版數(shù)據(jù),獲取相關(guān)信息;
對于從數(shù)據(jù)輸入界面輸入的基因突變數(shù)據(jù),HGVS計算程序計算HGVS名稱首先依賴于所輸入數(shù)據(jù)的格式;系統(tǒng)規(guī)定的數(shù)據(jù)輸入格式為:
Gene (R/M)S z/c
Gene 為基因的標(biāo)準(zhǔn)名稱,R為變異位點參考序列,M為變異位點突變序列,S為變異位點之后一段序列,該序列需為NCBI上gDNA上的一段序列,不拘內(nèi)含子還是外顯子,也不拘5’UTR區(qū)域或3’UTR區(qū)域,但允許大于10個堿基,如果使用CDS序列,如果圈選序列包含不同外顯子,在gDNA序列中不能檢索,則無法計算;z/c代表突變?yōu)殡s合型還是純合型,可以不填,不同突變類型的輸入格式簡述如下:
1)堿基置換情況,R和M分別是單個堿基;
2)堿基缺失,缺失時M用“-”表示;
3)堿基插入,R用“-”表示,即序列中在無堿基處出現(xiàn)新的堿基;
4)堿基重復(fù),輸入格式與堿基插入相同;
5) 缺失/插入,R和M其中至少一個的堿基數(shù)目要大于1,且不構(gòu)成倒位;
6)倒位,R和M的長度都必須大于1,且等長,且序列為反向,其格式與缺失/插入相同。
2.根據(jù)權(quán)利要求1所述的一種基因突變的HGVS名稱自動生成的方法:其特征在于,所述基因的種屬來源包括但不限于各種動物、各種植物、微生物、病毒及人工設(shè)計或改造的基因;
所述基因類型包括但不限于:基因組序列,轉(zhuǎn)錄本序列,RNA序列,線粒體DNA序列;
就基因組而言,包括但不限于基因的各個組成部分,用于編碼蛋白質(zhì)的外顯子區(qū)域,不編碼蛋白質(zhì)的外顯子區(qū)域,內(nèi)含子區(qū)域,5’-UTR區(qū),3’-UTR區(qū),以及其它尚未歸類的DNA序列;
就轉(zhuǎn)錄本序列而言,包括但不限于每個基因的已有轉(zhuǎn)錄本,以及僅在病人身上發(fā)現(xiàn),以及僅在病理部位發(fā)現(xiàn)的轉(zhuǎn)錄本;
就基因方向而言,包括與編碼RNA一致的序列,也包括與編碼RNA反向互補的序列。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于楊永臣,未經(jīng)楊永臣許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710298386.2/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





