[發明專利]確定棉纖維發育過程中上調基因和下調基因的方法在審
| 申請號: | 201410366425.4 | 申請日: | 2014-07-29 |
| 公開(公告)號: | CN105296604A | 公開(公告)日: | 2016-02-03 |
| 發明(設計)人: | 陳全家;曲延英;倪志勇;李月;劉超;康定明 | 申請(專利權)人: | 新疆農業大學 |
| 主分類號: | C12Q1/68 | 分類號: | C12Q1/68;C12N15/29;C07K14/415;C12N15/11;C12N15/53;C12N9/02;C12N15/82 |
| 代理公司: | 北京清亦華知識產權代理事務所(普通合伙) 11201 | 代理人: | 李志東 |
| 地址: | 830052 新疆維吾爾自治區*** | 國省代碼: | 新疆;65 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 確定 棉纖維 發育 過程 上調 基因 下調 方法 | ||
1.一種確定在棉花纖維發育過程中上調或者下調基因的方法,其特征在于,所述方法包括:
(1)分別從處于棉纖維發育第一時期和第二時期的樣本中獲得第一轉錄組和第二轉錄組,對所述第一和第二轉錄組進行測序,獲得第一轉錄組測序數據和第二轉錄組測序數據,所述第一轉錄組測序數據和第二轉錄組測序數據各自包含多個讀段;
(2)分別基于步驟(1)中的第一轉錄組測序數據和第二轉錄組測序數據進行一級組裝,獲得第一一級組裝數據和第二一級組裝數據,所述第一一級組裝數據和第二一級組裝數據各自由多個一級基因構成;
(3)合并獲自步驟(2)的第一一級組裝數據和第二一級組裝數據,利用所述第一一級組裝數據和第二一級組裝數據中有重疊的一級基因進行二級組裝,獲得二級組裝數據,所述二級組裝數據由多個二級基因構成;
(4)基于步驟(3)的二級組裝數據和參考基因的重疊關系進行三級組裝,獲得三級組裝數據,所述三級組裝數據由多個三級基因構成;
(5)計算所述三級組裝數據中各個三級基因在所述棉纖維發育第一時期樣本和所述棉纖維發育第二時期樣本中的表達量;
(6)確定獲自步驟(5)的各三級基因的在所述棉纖維發育第一時期樣本和所述棉纖維發育第二時期樣本中的表達量的差異是否顯著,以確定所述在棉纖維發育過程中的上調基因或者下調基因。
2.權利要求1所述的方法,其特征在于,所述樣本來源于棉花胚珠。
3.權利要求1所述的方法,其特征在于,所述棉纖維第一時期和第二時期分別選自0DPA、5DPA、10DPA、15DPA和25DPA中的任兩個不同的時期,所述樣本來源于同一棉種。
4.權利要求1所述的方法,其特征在于,所述棉纖維第一時期和第二時期為選自0DPA、5DPA、10DPA、15DPA和25DPA中的任一同一時期,所述樣本來源于不同棉種。
5.權利要求1所述的方法,其特征在于,步驟(1)的測序包括進行所述第一轉錄組和第二轉錄組測序文庫構建,所述測序文庫構建包括步驟:
a)分別從所述處于棉纖維發育第一時期的樣本和處于棉纖維發育第二時期的樣本中獲得第一mRNA和第二mRNA;
b)打斷從a)中獲得的第一mRNA和第二mRNA,獲得第一mRNA片段和第二mRNA片段;
c)分別以b)中的第一mRNA片段和第二mRNA片段為模板,反轉錄合成第一cDNA第一鏈和第二cDNA第一鏈;
d)分別以從c)中獲得的第一cDNA第一鏈和第二cDNA第一鏈為模板,獲得第一雙鏈cDNA和第二雙鏈cDNA;
e)分別對從d)中所得的第一雙鏈cDNA和第二雙鏈cDNA進行末端修復,加A以及連接測序接頭,獲得所述第一轉錄組測序文庫和所述第二轉錄組測序文庫。
6.權利要求5所述的方法,其特征在于,于步驟e)中連接測序接頭之后,進一步對連接測序接頭的片段進行大小選擇。
7.權利要求1所述的方法,其特征在于,步驟(2)中的一級組裝包括:
a)通過分別拼接所述第一轉錄組測序數據中的有重疊關系的讀段或者所述第二轉錄組測序數據中的有重疊關系的讀段,獲得第一重疊群和第二重疊群,所述第一重疊群和第二重疊群各自包含多個重疊片段;
b)基于所述第一轉錄組測序數據中的有距離關系的讀段或者所述第二轉錄本測序數據中的有距離關系的讀段,以及所述有距離關系的讀段在各自重疊群中的重疊片段上的位置,分別對所述第一重疊群或者所述第二重疊群中的重疊片段進行拼接,獲得所述第一一級組裝數據和第二一級組裝數據,所述有距離關系的讀段是指來自所述轉錄組測序文庫兩端的讀段。
8.權利要求1所述的方法,其特征在于,進行步驟(3)的二級組裝之前,對所述第一一級組裝數據和第二一級組裝數據合并后的數據去冗余。
9.權利要求1所述的方法,其特征在于,步驟4)中的參考基因是已知棉花的Unigene庫。
10.權利要求1所述的方法,其特征在于,進行步驟(5)之前包括,確定所述三級基因的編碼區序列。
11.權利要求10所述的方法,其特征在于,所述三級基因的編碼區序列是通過將所述三級基因比對已知蛋白數據庫來確定的。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于新疆農業大學,未經新疆農業大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201410366425.4/1.html,轉載請聲明來源鉆瓜專利網。





