[發(fā)明專利]基因探針信息注釋方法無效
| 申請?zhí)枺?/td> | 200610025972.1 | 申請日: | 2006-04-24 |
| 公開(公告)號: | CN101063988A | 公開(公告)日: | 2007-10-31 |
| 發(fā)明(設計)人: | 金剛;謝松旻;王超 | 申請(專利權)人: | 中國科學院上海生命科學研究院 |
| 主分類號: | G06F19/00 | 分類號: | G06F19/00;G06F17/30 |
| 代理公司: | 上海專利商標事務所有限公司 | 代理人: | 徐迅 |
| 地址: | 20003*** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基因 探針 信息 注釋 方法 | ||
技術領域
本發(fā)明涉及一種基因芯片技術平臺的構(gòu)建方法,尤其涉及一種基因芯片探針的信息注釋方法。
背景技術
基因芯片的出現(xiàn)是近年來高新技術領域中極具時代特征的重大進展,是物理學、微電子學與分子生物學綜合交叉形成的高新技術?;蛐酒夹g是一種高通量的技術,其基本原理是通過微加工工藝在厘米見方的芯片上集成有數(shù)以萬計的DNA探針,來實現(xiàn)對mRNA和DNA序列進行高效快捷的定量檢測,在基因功能的闡述、疾病原因及機理的探索、可能的診斷及治療靶點的發(fā)現(xiàn)等應用領域,基因芯片正發(fā)揮著越來越大的用途。
由于基因芯片具有高通量和高信息量的特性,因此其探針注釋系統(tǒng)是構(gòu)建基因芯片技術平臺的一個關鍵步驟?;蛐酒⑨屜到y(tǒng)主要功能是注釋芯片上數(shù)以萬計的基因探針、整合關于基因的序列、功能以及代謝通路的最新相關信息,以滿足基因芯片檢測結(jié)果自動化分析和基因芯片探針設計的需要。當前世界上著名的基因芯片注釋系統(tǒng)有:美國國立健康科學院Button等人發(fā)明的DAVID系統(tǒng)、美國約翰霍普金斯大學Wilkinson等人發(fā)明的DRAGON系統(tǒng)以及斯坦福大學發(fā)明Diehn等人發(fā)明的SOURCE系統(tǒng)。這些系統(tǒng)的基本原理都是利用數(shù)據(jù)倉庫技術,通過將各個公共源數(shù)據(jù)庫物理整合,建立基因芯片探針相關信息的“一站式”的記錄。
然而,這種技術具有很大的局限性:數(shù)據(jù)倉庫最大的限制在于該技術不能實時更新。同時,由于生命科學的發(fā)展日新月益,公共源數(shù)據(jù)庫每天都收錄和更新大量新的信息,每兩到三個月才更新一次的數(shù)據(jù)倉庫技術不能及時的收錄和整合基因探針的最新信息。以DAVID系統(tǒng)為例,其注釋結(jié)果里面就含有大量的無用的URL(Universal?Resource?Location),這些URL都不能提供給用戶正確的注釋結(jié)果。
數(shù)據(jù)倉庫注釋方法的另外一個局限在于由于公共源數(shù)據(jù)庫數(shù)據(jù)格式的不統(tǒng)一,導致隨著包含源數(shù)據(jù)庫和數(shù)據(jù)類型的數(shù)目越多,數(shù)據(jù)倉庫管理會變得越來越困難,因此數(shù)據(jù)倉庫方法的注釋能力有限。以前述的另一種探針注釋系統(tǒng)DRAGON系統(tǒng)為例,由于DRAGON系統(tǒng)的注釋能力有限,致使其不能注釋最常用的數(shù)據(jù)庫GenBank和LocusLink的信息。
由于基因探針信息注釋在基因芯片平臺建立及芯片檢測結(jié)果自動分析上的重要性,克服上述注釋系統(tǒng)的局限,建立更準確,更完善的注釋方法,是基因芯片技術領域急需解決的問題。
發(fā)明內(nèi)容
本發(fā)明的目的在于解決上述問題,提供了一種基因探針信息注釋方法,它克服了傳統(tǒng)基因芯片探針注釋系統(tǒng)的局限性,克服了數(shù)據(jù)倉庫注釋技術存在的問題,整合關于芯片探針靶點基因的序列、功能以及代謝通路的最新信息,有利于基因芯片檢測結(jié)果的自動化分析和基因芯片的探針設計。
本發(fā)明的技術方案為:一種基因探針信息注釋方法,其中包括:(1)制備基因芯片探針文庫的標識信息輸入到數(shù)據(jù)倉庫系統(tǒng);(2)通過數(shù)據(jù)倉庫系統(tǒng)的接口程序來提取所述基因探針標識信息與公共源數(shù)據(jù)庫標識信息的對應關系;(3)根據(jù)所述的對應關系建立與所述公共源數(shù)據(jù)庫相關的鏈接,并通過所述鏈接直接提取公共源數(shù)據(jù)庫中與所述基因芯片探針相關的具體信息;(4)解析所述具體信息并將其輸出。
上述的基因探針信息注釋方法,其中,所述數(shù)據(jù)倉庫系統(tǒng)包括NCBI的Entrez、EBI的Ensembl和Uniport數(shù)據(jù)倉庫系統(tǒng)。
上述的基因探針信息注釋方法,其中,所述接口包括Entrez的E-Utilities接口、Ensembl的ensmart接口、以及UniPort的SRS接口。
上述的基因探針信息注釋方法,其中,所述具體信息包括探針對應的基因相關信息、探針對應的基因編碼蛋白相關信息、探針對應的文獻信息、以及有利于芯片結(jié)果自動化分析的數(shù)據(jù)。
上述的基因探針信息注釋方法,其中,步驟(1)中制備基因芯片探針文庫的標識信息是登陸號碼、UniGene?Cluster標識符或者LocusLink標識符。
上述的基因探針信息注釋方法,其中,步驟(3)中,所述具體信息整理后以文本格式輸出至文件。
上述的基因探針信息注釋方法,其中,步驟(3)中,所述鏈接為URL鏈接。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國科學院上海生命科學研究院,未經(jīng)中國科學院上海生命科學研究院許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/200610025972.1/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06F 電數(shù)字數(shù)據(jù)處理
G06F19-00 專門適用于特定應用的數(shù)字計算或數(shù)據(jù)處理的設備或方法
G06F19-10 .生物信息學,即計算分子生物學中的遺傳或蛋白質(zhì)相關的數(shù)據(jù)處理方法或系統(tǒng)
G06F19-12 ..用于系統(tǒng)生物學的建?;蚍抡妫纾焊怕誓P突騽討B(tài)模型,遺傳基因管理網(wǎng)絡,蛋白質(zhì)交互作用網(wǎng)絡或新陳代謝作用網(wǎng)絡
G06F19-14 ..用于發(fā)展或進化的,例如:進化的保存區(qū)域決定或進化樹結(jié)構(gòu)
G06F19-16 ..用于分子結(jié)構(gòu)的,例如:結(jié)構(gòu)排序,結(jié)構(gòu)或功能關系,蛋白質(zhì)折疊,結(jié)構(gòu)域拓撲,用結(jié)構(gòu)數(shù)據(jù)的藥靶,涉及二維或三維結(jié)構(gòu)的
G06F19-18 ..用于功能性基因組學或蛋白質(zhì)組學的,例如:基因型–表型關聯(lián),不均衡連接,種群遺傳學,結(jié)合位置鑒定,變異發(fā)生,基因型或染色體組的注釋,蛋白質(zhì)相互作用或蛋白質(zhì)核酸的相互作用
- 信息記錄介質(zhì)、信息記錄方法、信息記錄設備、信息再現(xiàn)方法和信息再現(xiàn)設備
- 信息記錄裝置、信息記錄方法、信息記錄介質(zhì)、信息復制裝置和信息復制方法
- 信息記錄裝置、信息再現(xiàn)裝置、信息記錄方法、信息再現(xiàn)方法、信息記錄程序、信息再現(xiàn)程序、以及信息記錄介質(zhì)
- 信息記錄裝置、信息再現(xiàn)裝置、信息記錄方法、信息再現(xiàn)方法、信息記錄程序、信息再現(xiàn)程序、以及信息記錄介質(zhì)
- 信息記錄設備、信息重放設備、信息記錄方法、信息重放方法、以及信息記錄介質(zhì)
- 信息存儲介質(zhì)、信息記錄方法、信息重放方法、信息記錄設備、以及信息重放設備
- 信息存儲介質(zhì)、信息記錄方法、信息回放方法、信息記錄設備和信息回放設備
- 信息記錄介質(zhì)、信息記錄方法、信息記錄裝置、信息再現(xiàn)方法和信息再現(xiàn)裝置
- 信息終端,信息終端的信息呈現(xiàn)方法和信息呈現(xiàn)程序
- 信息創(chuàng)建、信息發(fā)送方法及信息創(chuàng)建、信息發(fā)送裝置





