[發(fā)明專利]一種基因多序列比對方法、設(shè)備和系統(tǒng)在審
| 申請?zhí)枺?/td> | 202210096587.5 | 申請日: | 2022-01-26 |
| 公開(公告)號: | CN114420207A | 公開(公告)日: | 2022-04-29 |
| 發(fā)明(設(shè)計)人: | 劉思嘉;田菲;陳生學;田得紅;王賀崐元;趙凱 | 申請(專利權(quán))人: | 中國科學院西北高原生物研究所 |
| 主分類號: | G16B20/30 | 分類號: | G16B20/30 |
| 代理公司: | 成都高遠知識產(chǎn)權(quán)代理事務所(普通合伙) 51222 | 代理人: | 鄭勇力;張娟 |
| 地址: | 810000 *** | 國省代碼: | 青海;63 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基因 序列 方法 設(shè)備 系統(tǒng) | ||
本發(fā)明屬于生物信息學技術(shù)領(lǐng)域,具體涉及一種基因多序列比對方法、設(shè)備和系統(tǒng)。本發(fā)明的基因多序列比對方法包括如下步驟:步驟1,設(shè)置模板信息,所述模板信息包括待分析基因的模板序列、保守基序位置和保守基序長度;步驟2,根據(jù)步驟1的模板信息作為參照,對待分析序列進行校正和多序列全局比對,形成數(shù)據(jù)集。本發(fā)明還提供應用上述基因多序列比對方法的設(shè)備和系統(tǒng)。本發(fā)明的技術(shù)方案能夠大大減少基因多序列比對的工作量,顯著提高多序列比對工作的效率。因此,具有很好的應用前景。
技術(shù)領(lǐng)域
本發(fā)明屬于生物信息學技術(shù)領(lǐng)域,具體涉及一種基因多序列比對方法、設(shè)備和系統(tǒng)。
背景技術(shù)
基因的多序列比對是生物信息學的基本組成和重要基礎(chǔ)。序列比對的基本思想是,基于生物學中序列決定結(jié)構(gòu),結(jié)構(gòu)決定功能的普遍規(guī)律,將核酸序列和蛋白質(zhì)一級結(jié)構(gòu)上的序列都看成由基本字符組成的字符串,檢測序列之間的相似性,發(fā)現(xiàn)生物序列中的功能、結(jié)構(gòu)和進化的信息。
例如,裂腹魚類Cytb基因多序列對比是一種重要的基因多序列比對研究體系。細胞色素b基因(Cytb)是真核生物線粒體基因組中的一個編碼基因,因其單拷貝、進化速率適中、多態(tài)性位點豐富等優(yōu)點,是常用于研究生物遺傳進化及多樣性的靶基因。裂腹魚類是青藏高原及周邊地區(qū)特有的一個鯉科裂腹魚亞科的魚類物種類群,是我國青藏高原地區(qū)重要的漁業(yè)資源和生態(tài)關(guān)鍵物種。在物種的起源和進化上,裂腹魚類的物種都有較近的親緣關(guān)系,形態(tài)上較為相似,在Cytb基因的序列結(jié)構(gòu)上既有不同物種特異的多態(tài)位點,也有裂腹魚類共有的保守基序。因此,Cytb基因是區(qū)分不同裂腹魚物種,研究其系統(tǒng)進化和物種分類常用的靶基因。在研究方法上,最重要和最基礎(chǔ)的是Cytb基因的測序和序列比對分析。首先利用PCR技術(shù),根據(jù)裂腹魚類Cytb基因的通用引物(L14724和H15915)體外擴增獲得包含Cytb基因開放閱讀框(ORF)全長的基因序列,接著,利用焦磷酸測序技術(shù),對擴增產(chǎn)物的脫氧核糖核苷酸組成順序進行測定,獲得由不同堿基構(gòu)成的序列信息,然后,利用基因序列軟件對不同樣本的Cytb基因序列進行比對分析,從而獲得遺傳變異信息,用于物種鑒定、分類和系統(tǒng)進化等研究。
現(xiàn)有的基因序列比對方法和軟件已經(jīng)商業(yè)化,具體包括CLUSTALX、MEGA、MUSCLE、MAFFT等在線軟件或PC安裝軟件。其中MEGA軟件集成了CLUSTALX、MUSCLE等多種比對方法,是最常用的序列比對分析軟件,有較強的可視化效果。
雖然這些軟件已經(jīng)較為成熟,但是它們在使用時需要輸入的基因序列數(shù)據(jù)必須是標準化的格式。然而,在實際工作中,測序得到的基因序列通常是不符合這些軟件的輸入要求的。例如,測序得到的基因序列可能出現(xiàn)如下情況:是正義鏈序列或反義鏈序列,可能包含引物、接頭和終止密碼子之后的“垃圾”序列,可能包括不在對比范圍內(nèi)的冗余序列,存在5’和3’端殘缺,包含測序錯誤的位點等。
因此,現(xiàn)有的測序數(shù)據(jù)在利用軟件進行比對前,還需要研究者根據(jù)自身對相關(guān)物種的研究經(jīng)驗,對序列進行編輯、校正。這大大增加研究者的工作量,不利于基因多序列比對工作的高效進行。
發(fā)明內(nèi)容
針對現(xiàn)有技術(shù)的缺陷,本發(fā)明提供一種基因多序列比對方法、設(shè)備和系統(tǒng),目的在于提供一種包含對基因序列進行自動編輯、校正步驟的基因多序列比對方法,減少相關(guān)研究工作中研究者的工作量,提高基因多序列比對工作的效率。
一種基因多序列比對方法,包括如下步驟:
步驟1,設(shè)置模板信息,所述模板信息包括待分析基因的模板序列和保守基序的信息;
步驟2,根據(jù)步驟1的模板信息作為參照,對待分析序列進行校正和多序列全局比對,形成數(shù)據(jù)集。
優(yōu)選的,步驟1中,所述模板信息是通過待分析基因的正義鏈簡并序列獲得的。
優(yōu)選的,步驟2中,進行校正和多序列全局比對的具體步驟如下:
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于中國科學院西北高原生物研究所,未經(jīng)中國科學院西北高原生物研究所許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202210096587.5/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 傳感設(shè)備、檢索設(shè)備和中繼設(shè)備
- 簽名設(shè)備、檢驗設(shè)備、驗證設(shè)備、加密設(shè)備及解密設(shè)備
- 色彩調(diào)整設(shè)備、顯示設(shè)備、打印設(shè)備、圖像處理設(shè)備
- 驅(qū)動設(shè)備、定影設(shè)備和成像設(shè)備
- 發(fā)送設(shè)備、中繼設(shè)備和接收設(shè)備
- 定點設(shè)備、接口設(shè)備和顯示設(shè)備
- 傳輸設(shè)備、DP源設(shè)備、接收設(shè)備以及DP接受設(shè)備
- 設(shè)備綁定方法、設(shè)備、終端設(shè)備以及網(wǎng)絡側(cè)設(shè)備
- 設(shè)備、主設(shè)備及從設(shè)備
- 設(shè)備向設(shè)備轉(zhuǎn)發(fā)





