[發明專利]一種利用測序技術分析豬乳腺組織基因表達差異的方法無效
| 申請號: | 201110385816.7 | 申請日: | 2011-11-29 |
| 公開(公告)號: | CN102409099A | 公開(公告)日: | 2012-04-11 |
| 發明(設計)人: | 彭靜;張立凡;王穎;徐寧迎 | 申請(專利權)人: | 浙江大學 |
| 主分類號: | C12Q1/68 | 分類號: | C12Q1/68 |
| 代理公司: | 杭州求是專利事務所有限公司 33200 | 代理人: | 周烽 |
| 地址: | 310058 浙江*** | 國省代碼: | 浙江;33 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 利用 技術 分析 乳腺 組織 基因 表達 差異 方法 | ||
1.一種利用測序技術分析豬乳腺組織基因表達差異的方法,其特征在于,該方法包括以下步驟:
(1)總RNA?的提取:金華豬和大約克豬屠宰后,采集乳腺組織樣本,研缽置于高壓滅菌鍋中滅菌,然后將乳腺組織樣本放入研缽,倒入液氮,將乳腺組織樣本研磨成粉末狀態;然后取樣品粉末50-100mg,移至已加入1ml?Trizol試劑的2ml離心管中并混勻,室溫條件下靜置5-10min,讓樣品中核蛋白混合物完全裂解;在離心管中加入200ul氯仿,劇烈震蕩15秒后,室溫條件下靜置2-3min;
然后放入離心機中,4℃、13000rpm離心15min,上層無色水相為RNA,下層紅色是酚、氯仿層;吸取上層無色水相至一新的離心管中,加入500ul異丙醇(沉淀RNA),室溫條件下靜置10min;然后4℃、13000rpm離心10min,RNA被沉淀,呈膠狀顆粒;棄上清,加入1ml用DEPC水配置的體積百分比濃度為75%酒精,旋轉管子混勻;4℃、10000rpm離心5min;棄乙醇,沉淀物在室溫條件下干燥5-10min;加入50ul?體積百分比濃度為0.1%的DEPC水溶解RNA;
(2)構建組織RNA-Seq測序cDNA文庫,采用Illumina?Satandard??Kit?試劑盒,cDNA文庫的制備主要包括以下子步驟:(2.1)mRNA分離和片段化;用poly(T)寡聚核苷酸從上述2個總RNA池中抽取帶poly(A)尾的RNA,其中的主要部分就是編碼基因所轉錄的mRNA,然后將所得的mRNA用裂解液在70攝氏度下裂解5分鐘;(2.2)cDNA合成與末端修復;利用N6隨機引物和反轉錄酶將片段化的mRNA合成cDNA一鏈,隨后用RNaseH和DNA多聚酶再將一鏈cDNA合成雙鏈cDNA,然后利用T4DNA多聚酶和KlenowDNA多聚酶對二鏈cDNA進行末端修飾;(2.3)連接5′和3′測序接頭;用Illumina?adaptor?mix和T4DNA酶將上述經過末端修飾的cDNA連接到Illumina雙端測序接頭上,這樣得到將用于測序的cDNA;(2.4)PCR擴增cDNA文庫;在以上過程,將RNA隨機片段化和采用隨機引物進行反轉錄,都是為了使所得cDNA片段較均勻地取自各個轉錄本,為了提高測序效率,一般采用電泳切膠法(瓊脂糖凝膠的質量體積比濃度為0.02g/ml),獲取長度范圍在200-250bp的cDNA片段,再經過15個循環的PCR線性擴增后,最后用QIAquick?PCR?purification?KIT試劑盒富集和純化得到最終的cDNA文庫;
(3)采用Illumina?GAⅡX測序儀器對建庫產物進行測序:上述純化好的cDNA文庫放進基因組分析泳道中,采用邊合成邊測序法,利用Illumina?GA?Ⅱx測序平臺進行5′和3′雙向75nt長度RNA-Seq測序,每個通道將產生數百萬條原始的讀段(Read),Read的測序讀長為75bp;
(4)RNA-Seq數據的基本處理,該步驟包括以下子步驟:
(4.1)將測序數據定位到參考基因組:獲得RNA-Seq的原始數據后,首先需要將所有測序讀段通過序列映射定位到Ensembl數據庫的豬基因組上,這需要使用TopHat軟件以及Bowtie軟件共同來完成;首先,通過Bowtie采用Burrows-Wheeler轉換將豬基因組按照一定規則壓縮并建立索引,然后采用Tophat軟件來查找和回溯來定位讀段;不過在讀段定位之前,需要按照Illumina標準程序對讀段進行質量過濾,Tophat允許每個讀段多重比對,并且可以允許最多出現2個缺省的錯配;定位的結果接著被用于鑒定可以表達的“islands”,這也就是潛在的外顯子;如果存在有些讀段不能直接定位到參考基因組上,那么就會將這些讀段與Tophat數據庫中公認的結合位點進行比對,從而可以簽訂出潛在的外顯子結合位點;最后,讀段定位到基因組后采用SAM格式來存儲,而鑒定的結合位點會以BED文件保存;
(4.2)轉錄本簽訂上述憑借好的序列會進一步使用Cuffinks軟件來預測新的轉錄本;RNA-Seq數據能在一定程度上推斷對于每一個轉錄本的表達水平,并檢測其在不同樣品間的差異表達和調控;因為Cuffinks軟件可以不依賴一致參考基因的轉錄本去預測未知的、潛在的新的轉錄本,這就使得Cuffinks軟件可以應用于位置物種選擇性剪切和轉錄本的鑒定;預測的轉錄本會存儲在以transcript.expr命名的文件夾里,而簽訂的基因則會儲存在以genes.expr命名的文件夾下面;用FPKM進行基因表達估計,FPKM就是每百萬讀段中來自于某基因外顯子每千堿基長度的讀段數,公式表示為:FPKM=(基因區段計數/基因長度*測序深度)*109;最后預測的轉錄本和他們相關的外顯子會形成GTF格式文件,并被儲存在transcript.gtf文件夾下面;
(4.3)基因和轉錄本注釋:一旦所有的讀段序列用Cuffinks軟件進行組合后,組合轉錄本的GTF文件將和參考基因組一起進行比對;利用Cuffinks軟件中得Cuffcompare模塊可以對每個轉錄本是已知或未知進行分類;這樣,所有的轉錄本包括與參考基因組匹配的(class-code:u?or?-)或者包含在參考基因組內的(class-code:c)以及發現新的轉錄本亞型(class-code;j)和潛在的新的轉錄本(class-code:u?or?-)都會被簽訂出來;一份包括所有預測的轉錄本和參考轉錄本的組合文件將會生成并被存儲在<Sample_Name>_combined.gtf文件下面;
(5)比較兩種樣本中基因表達的差異:用金華豬乳腺組織中FPKM值與大約克豬乳腺組織中FPKM值的比值的絕對表達倍數來表示金華豬和大約克豬乳腺組織中差異基因表達水平;
(6)差異表達基因的GO分析:基因功能聚類分析采用GO方法分析,使用功能基因注釋軟件包bioconducter分析組織中功能相關基因表達變化;一般來說,單個基因的表達情況的改變不能完全反應特定細胞功能和通路的整體變化情況;因為生物個體的細胞功能的實現并不僅僅是依靠一兩個基因功能的改變來實現的;而基因本體(Gene?Ontology,GO),也就是一套與基因有關的樹狀的詞匯表的引入為基因功能數據挖掘提供了新的思路;GO分析主要目的在于發掘出與基因差異表達現象關聯的特征基因功能類的組合;GO分析是根據挑選出的有注釋的差異基因,計算這些差異基因同GO分類中某個特定的分支的超幾何分布關系;通過GO分析可以找到富集差異基因的GO分類條目,尋找不同樣品間的差異基因可能和那些基因功能的改變有關。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于浙江大學,未經浙江大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201110385816.7/1.html,轉載請聲明來源鉆瓜專利網。





