[發明專利]基因芯片差別基因識別方法在審
| 申請號: | 201410376287.8 | 申請日: | 2014-08-03 |
| 公開(公告)號: | CN105316400A | 公開(公告)日: | 2016-02-10 |
| 發明(設計)人: | 嚴冰冰;易雪蓮;鄒曉文;孔祥生 | 申請(專利權)人: | 晶能生物技術(上海)有限公司 |
| 主分類號: | C12Q1/68 | 分類號: | C12Q1/68 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 201111 上海市閔*** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基因芯片 差別 基因 識別 方法 | ||
技術領域
本發明屬于分子生物學技術領域以及信息技術領域,本發明涉及一種基因芯片差別基因識別方法,本方法適用于小樣本的基因芯片實驗設計。
背景技術
基因芯片,是指將許多已知序列寡核苷酸或cDNA片段有規律地排列在基片上,將待測的樣品與芯片互補配對原則進行雜交。通過熒光檢測系統對芯片進行掃描,并配以計算機系統對每一探針上的熒光信號做出檢測和比較,可以迅速得出實驗結果。基因芯片可以對大量基因的表達水平進行快速、準確、高效地檢測,且只需要少量樣品。基因芯片技術有效且應用廣泛。
差別基因的識別是基因芯片分析及其重要的步驟。但是實際中,由于基因芯片價格昂貴,樣本數量少,這類芯片數據目前的分析方法基本上是經驗算法,其敏感性與特異性難以估計,有較大誤差。本發明我們提出一種新算法,來對小樣本基因芯片產生的差別基因進行篩選。
發明內容
本發明的目的在于公開一種基因芯片差別基因識別方法,對小樣本基因芯片差別基因進行篩選。
為此,本發明給出的技術方案為:
步驟1,對芯片基因數據進行歸一化處理,得到各芯片基因數據歸一化數據D;
步驟2,獲取已知基因序列庫L,以及各基因數據歸一化表述DL;
步驟3,設定差異閾值T;
步驟4,將基因芯片中基因和基因庫中基因進行比較,獲取二者差異DIFF=D-DL;
步驟5,步驟4中,如果基因芯片中基因和基因庫中所有基因的差異DIFF均大于閾值T,則定義為差別基因。
本方法適用于小樣本的基因芯片實驗設計,克服了常規方法難以對小樣本基因芯片進行差別基因片段的缺陷。
具體實施方式
以下結合實施例對本發明技術方案做進一步說明。
本實施例中采用的本領域的常規方法對芯片數據進行歸一化處理,如使用芯片掃描圖像處理軟件(例如GenePixpro4.0)獲得基因水平的表達值數據。接著對芯片數據進行芯片間的歸一化處理。
實施例1
步驟1,對芯片基因數據進行歸一化處理,得到各芯片基因數據歸一化數據D;
本步驟主要用于提取芯片上的基因數據,并對其進行歸一化處理,便于后續的對比。比如采用GenePixpro4.0獲得基因水平的表達值數據,接著對芯片數據進行芯片間的歸一化處理。
步驟2,獲取已知基因序列庫L;
這里的基因序列庫的獲取可以來自于各種公開的方式。另外,這里的基因序列庫可以局限在本芯片需要確認的基因中;也可以選取本芯片目的基因所屬分類的基因庫。原則為能夠盡可能的完成基因對比覆蓋。并得到庫中各基因的歸一化數據DL。
步驟3,設定差異閾值T;此處的閾值采用設置統一閾值的方式,也可以考慮針對不同基因進行不同的閾值設置。進一步,還可以根據溫度等進行調整,加入調整因子k。
步驟4,將基因芯片中基因和基因庫中基因進行比較;將從步驟1中獲取的某芯片基因數據和基因庫中各基因數據進行對比,得到其差異數據DIFF=D-DL。注意:這里的D是某個芯片基因數據,而DL是某個基因庫數據。
步驟5,如果此芯片基因數據和基因庫中各基因的差異DIFF均大于各自閾值,則定義為差別基因。如果設置了不同的閾值和調整因子,則在進行比較時,需要根據不同的條件采用不同的閾值。一個芯片基因數據識別完成后,選取下一個芯片基因數據重復步驟4和5,直到整個芯片數據識別完成。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于晶能生物技術(上海)有限公司,未經晶能生物技術(上海)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201410376287.8/2.html,轉載請聲明來源鉆瓜專利網。





