[發明專利]一種計算寡核苷酸基因芯片的UniGene表達量的算法無效
| 申請號: | 200710173615.4 | 申請日: | 2007-12-28 |
| 公開(公告)號: | CN101261689A | 公開(公告)日: | 2008-09-10 |
| 發明(設計)人: | 曾華宗;劉極龍 | 申請(專利權)人: | 上海敏芯信息科技有限公司 |
| 主分類號: | G06N3/12 | 分類號: | G06N3/12 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 200433上海市楊*** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 計算 寡核苷酸 基因芯片 unigene 表達 算法 | ||
技術領域
本發明屬于生物技術領域,涉及基因芯片方面。
背景技術
Affymetrix公司(Santa?Clara,USA)是高密度寡核苷酸基因芯片全球最大的提供商。該公司在制造微陣列的生產過程中結合了化學和半導體技術,使Affymetrix在單個陣列1.25/5.25cm2的硅片上原位合成上百萬種寡核苷酸探針。
基因芯片與熒光標記的RNA樣本雜交后,使用芯片掃描儀可以讀取雜交信號。隨后使用Operating?software(GCOS)等軟件可以做探針水平的背景扣除和歸一化處理。然后使用相應的概要算法,即求每個探針集內所有探針的某種平均值,作為最終探針集的表達值。常用的概要算法有:RMA(Bolstad,BM.(2004)Low?LevelAnalysis?of?High-density?oligonucleotide?array?data:Background,normalization?and?summarization[dissertation].Department?of?Statistics,University?of?California?at?Berkeley),GCRMA(Wu,Z.et.al.(2004)Amodel-based?background?adjustment?for?oligonucleotide?expressionarrays.J.Am.Stat.Assoc.,99,909-917),PLIER(Affymetrix,Inc.(2005)Technical?note:guide?to?probe?logarithmic?intensity?error(PLIER)estimation),MBEI(Li,C.and?Wong,H.W.(2001a)Model-based?analysisof?oligonucleotide?arrays:expression?index?computation?and?outlierdetection.Proc.Nat.Acad.Sci.,98,31-36,Li,C?and?Wong,H.W.(2001b)Model-based?analysis?of?oligonucleotide?arrays:model?validation,designissues?and?standard?error?application.Genome?Biol.,2,research0032.1-0032.11)和FARMS(Hochreiter,S.et?al.(2006)A?newsummarization?method?for?Affymetrix?probe?level?data.Bioinformatics,22,943-949)等。
由于一個基因往往有2個以上的探針集,因此目前的概要算法計算出來的結果,將是一個基因對應多個表達值。這雖然為研究者提供了更為豐富的信息,但同時也使在基因芯片后續的對單個基因的分析過程中讓人無所適從。有人將一個基因的不同探針集的表達值取平均值,作為該基因的最終表達值(Breslin?T.et?al.(2005)Signaltransduction?pathway?profiling?of?individual?tumor?samples.BMC?Bioinformatics,6:163)。也有人發現,一個基因的不同探針集的表達值的一致性并不好,使用平均值顯得不夠合理,于是選擇絕對表達值最高的探針集作為一個基因的表達值(Subramanian?A.etal.(2005)Gene?set?enrichment?analysis:a?knowledge-basedapproach?for?interpreting?genome-wide?expression?profiles.Proc?Natl?Acad?Sci?U?S?A,102(43):15545-50)。但是,這種方法對基因水平表達值的估計仍是不夠準確的。這里,我們提出一種新的方法,從探針而不是探針集水平入手,采用合適的概要算法,直接求得UniGene的表達值,從而減少了誤差。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于上海敏芯信息科技有限公司,未經上海敏芯信息科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/200710173615.4/2.html,轉載請聲明來源鉆瓜專利網。





