[發明專利]一種針對目標生物的目標基因建立系統進化樹的方法無效
| 申請號: | 200910158233.3 | 申請日: | 2009-07-23 |
| 公開(公告)號: | CN101962671A | 公開(公告)日: | 2011-02-02 |
| 發明(設計)人: | 王穎 | 申請(專利權)人: | 王穎 |
| 主分類號: | C12Q1/68 | 分類號: | C12Q1/68;G06F17/30 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 322000 浙江省義烏*** | 國省代碼: | 浙江;33 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 針對 目標 生物 基因 建立 系統 進化 方法 | ||
技術領域
本發明涉及遺傳信息分析方法,特別是涉及系統進化樹的建立方法。
背景技術
在對生物進化和系統分類進行研究時,常用一種樹狀分枝的圖型來表示各種生物之間的親緣關系,這種樹狀分枝的圖型被稱為系統進化樹(phylogenetic?tree,也叫系統發育樹),簡稱系統樹。通過比較生物大分子序列差異的數值來構建的系統樹稱為分子系統樹。系統進化樹分枝的末端和分枝的連結點稱為結,表示生物類群,分枝末端的結代表仍生存的種類。系統進化樹可以有時間比例,或者用結之間的分枝長度變化來表現序列的差異值。系統進化樹有無根樹和有根樹(rooted?tree)兩種形式之分。前者只表示生物類群之間的系統進化關系,不反映進化途徑;而后者不僅表示出生物之間的親疏,而且反映出它們有共同的起源及進化方向。構建有根的系統進化樹是相當困難的,例如,連結4種生物的無根樹只有3種可能,而有根樹則存在15種可能。
構建分子系統(進化)樹,是在進行序列測定獲得原始序列資料后,由計算機排序,使各分子的序列同源位點對應,并計算出相似性或進化距離。接著,使用計算機軟件根據各分子序列的相似性或進化距離構建系統進化樹。計算機分析系統采用進化相關性構建系統樹時,可以有諸多方法,其中常用有最節省分析法或稱簡約法。這種方法推斷譜系的原理是:在所有可能的譜系關系中,涉及進化改變的序列特征數最少的譜系是最可信的。因此,在比較過程中要找到比較決定性的分子序列。這種分析方法是基于“進化變化的發生是沿著最短的途徑、發生最少的、變化從祖先進化成今天所比較的生物種類”這一假設。
伍斯(1981年)等提出了一個函蓋整個生命界的有根系統進化樹,而后又進行了多次修改和補充,該系統進化樹勾畫了生物進化的大致輪廓。根部的結代表地球上最先出現的生物,為現有生物的共同祖先。從該系統進化樹所反映的進化關系可以看出,真核生物離共同祖先最遠,它們是進化程度最高的生物種類。
在目前的分子生物領域的研究中,隨著不同物種遺傳信息尤其是基因組和蛋白組測序的快速發展,產生了大量的DNA和蛋白序列信息,因此非常需要一種簡便而快速的分析方法來對這些數據進行有效的分析,以提取其中包含的大量信息,用于對目標生物的目標基因進行研究。其中,建立系統進化樹是眾多方法中最為常見的分析方法之一。
目前,關于系統進化樹的研究主要集中在軟件的開發及其與數據庫的接合,現有的系統進化樹建立方法多基于軟件功能的強化和多閾值優化組合設定,而缺少從生物親緣關系和數據庫優化利用的角度來改進系統進化樹的建立方法。
發明內容
為了解決上述問題,本發明人提出了一種改進的針對目標生物的目標基因建立系統進化樹的方法,所述方法包括如下步驟:
1)數據的獲取;
2)序列的比對和分析;和
3)系統進化樹的構建;
其中,在所述第1)步驟中,下載所述目標蛋白的結構域,通過基因組或蛋白組已經測序完成的生物蛋白數據庫搜索獲取含有所述結構域的序列,并使用基因組或蛋白組已經測序完成的生物的目標基因搜索近緣植物的蛋白序列。
在一個優選的方案中,所述目標生物為植物。
在一個優選的方案中,所述植物為開花植物。
在一個優選的方案中,所述開花植物為青花菜(Brassica?oleraceaL.var.italica?P.),并且所述近緣植物為擬南芥、大白菜和/或油菜。
優選的是,在第1)步驟中,所述結構域從Pfam網站上下載。
優選的是,在第1)步驟中,所述生物蛋白數據庫為NCBI蛋白數據庫和/或開花植物EST庫(The?Floral?Genome?Project,http://fgp.bio.psu.edu/),選擇閾值為閾值E1e-5。
優選的是,所述第2)步驟采用Clustal?X1.83軟件以默認參數進行。
優選的是,在所述第2)步驟中,還包括手工校對修正所述結構域兩側的比對結果和去除缺口(gap)序列,更優選包括統計保守位點和變異區。
更優選的是,所述第3)步驟采用MEGA4.0軟件的鄰接法(neighbor-joining?tree)構建。
由于本發明方法包括上述第1)至3)步驟,而且從物種親緣關系和基因組或蛋白組完成測序的數據庫兩方面予以結合考慮,因此可以建立更加準確的系統進化樹,從而可以為今后基因功能的驗證提供更具有價值的參考。
附圖說明
圖1植物CesA基因編碼氨基酸序列保守區QVLRW的多重比對結果,箭頭所示為保守區QVLRW;和
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于王穎,未經王穎許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/200910158233.3/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:柵結構及其制造方法
- 下一篇:一種確定網元間拓撲關系的方法及系統





