[發明專利]生物基因組簡單重復序列的發掘方法及設備有效
| 申請號: | 201110414015.9 | 申請日: | 2011-12-13 |
| 公開(公告)號: | CN102495977A | 公開(公告)日: | 2012-06-13 |
| 發明(設計)人: | 任民;王志德;劉艷華;張興偉;牟建民 | 申請(專利權)人: | 中國農業科學院煙草研究所 |
| 主分類號: | G06F19/24 | 分類號: | G06F19/24 |
| 代理公司: | 北京市盛峰律師事務所 11337 | 代理人: | 趙建剛 |
| 地址: | 266101 山東*** | 國省代碼: | 山東;37 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 生物 基因組 簡單 重復 序列 發掘 方法 設備 | ||
1.一種生物基因組簡單重復序列的發掘方法,其特征在于,包括以下步驟:
根據需要發掘的生物基因組簡單重復序列SSR的特征構建正則表達式;
通過所述正則表達式分析待分析序列,判斷所述待分析序列中是否存在符合所述正則表達式要求的目標SSR,如果判斷結果為是,則輸出所述目標SSR;如果判斷結果為否,則顯示所述待分析序列中不存在所述目標SSR的信息。
2.根據權利要求1所述的生物基因組簡單重復序列的發掘方法,其特征在于,所述需要發掘的生物基因組簡單重復序列SSR的特征包括:
所述需要發掘的生物基因組簡單重復序列SSR中的基序的最小長度信息、所述基序的最大長度信息和所述基序的最少再重復次數信息,其中,所述基序指所述SSR中的重復單元。
3.根據權利要求2所述的生物基因組簡單重復序列的發掘方法,其特征在于,
所述正則表達式的形式為:(.{i,j}?)(/1){k,},其中,i、j、k分別表示所述目標SSR中的基序的最小長度值、所述基序的最大長度值、所述基序的最少再重復次數。
4.根據權利要求1所述的生物基因組簡單重復序列的發掘方法,其特征在于,在所述判斷結果為是,之后還包括:
進一步判斷所述目標SSR是否由單一堿基組成,如果判斷結果為是,則刪除所述目標SSR,如果判斷結果為否,則輸出所述目標SSR。
5.一種生物基因組簡單重復序列的發掘設備,其特征在于,包括:
構建模塊:用于根據需要發掘的生物基因組簡單重復序列SSR的特征構建正則表達式;
第一判斷模塊:用于通過所述構建模塊構建的所述正則表達式分析待分析序列,判斷所述待分析序列中是否存在符合所述構建模塊構建的所述正則表達式要求的目標SSR;
輸出模塊:用于當所述第一判斷模塊的判斷結果為是時,輸出所述目標SSR;
顯示模塊:用于當所述第一判斷模塊的判斷結果為否時,顯示所述待分析序列中不存在所述目標SSR的信息。
6.根據權利要求5所述的生物基因組簡單重復序列的發掘設備,其特征在于,所述需要發掘的生物基因組簡單重復序列SSR的特征包括:
所述需要發掘的生物基因組簡單重復序列SSR中的基序的最小長度信息、所述基序的最大長度信息和所述基序的最少再重復次數信息,其中,所述基序指所述SSR中的重復單元。
7.根據權利要求6所述的生物基因組簡單重復序列的發掘設備,其特征在于,
所述正則表達式的形式為:(.{i,j}?)(/1){k,},其中,i、j、k分別表示所述目標SSR中的基序的最小長度值、所述基序的最大長度值、所述基序的最少再重復次數。
8.根據權利要求5所述的生物基因組簡單重復序列的發掘設備,其特征在于,還包括:第二判斷模塊和刪除模塊;
所述第二判斷模塊用于:當所述第一判斷模塊判斷存在符合所述正則表達式要求的目標SSR時,進一步判斷所述目標SSR是否由單一堿基組成;
所述刪除模塊用于:當所述第二判斷模塊的判斷結果為是時,刪除所述目標SSR;
所述輸出模塊還用于:當所述第二判斷模塊的判斷結果為否時,輸出所述目標SSR。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國農業科學院煙草研究所,未經中國農業科學院煙草研究所許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201110414015.9/1.html,轉載請聲明來源鉆瓜專利網。
- 同類專利
- 專利分類
G06F 電數字數據處理
G06F19-00 專門適用于特定應用的數字計算或數據處理的設備或方法
G06F19-10 .生物信息學,即計算分子生物學中的遺傳或蛋白質相關的數據處理方法或系統
G06F19-12 ..用于系統生物學的建模或仿真,例如:概率模型或動態模型,遺傳基因管理網絡,蛋白質交互作用網絡或新陳代謝作用網絡
G06F19-14 ..用于發展或進化的,例如:進化的保存區域決定或進化樹結構
G06F19-16 ..用于分子結構的,例如:結構排序,結構或功能關系,蛋白質折疊,結構域拓撲,用結構數據的藥靶,涉及二維或三維結構的
G06F19-18 ..用于功能性基因組學或蛋白質組學的,例如:基因型–表型關聯,不均衡連接,種群遺傳學,結合位置鑒定,變異發生,基因型或染色體組的注釋,蛋白質相互作用或蛋白質核酸的相互作用





