[發明專利]一種推斷寡核苷酸在基因組上結合位點的方法和系統在審
| 申請號: | 201410568387.0 | 申請日: | 2014-10-22 |
| 公開(公告)號: | CN105590038A | 公開(公告)日: | 2016-05-18 |
| 發明(設計)人: | 張成崗;屈武斌;劉哲言 | 申請(專利權)人: | 中國人民解放軍軍事醫學科學院放射與輻射醫學研究所;北京云醫國際科技有限公司 |
| 主分類號: | G06F19/18 | 分類號: | G06F19/18;G06F17/30 |
| 代理公司: | 北京同立鈞成知識產權代理有限公司 11205 | 代理人: | 劉芳 |
| 地址: | 100850*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 推斷 寡核苷酸 基因組 結合 方法 系統 | ||
1.一種推斷寡核苷酸在基因組上結合位點的方法,其特征在于,包括:
構建任意7-mer寡核苷酸的熱力學信息的索引表,所述熱力學信息為所 述寡核苷酸與其所有結合序列兩兩雜交的信息,包括雜交結構、雜交序列、 焓、熵以及自由能;
利用所述索引表獲取待推斷寡核苷酸的熱力學信息,并在獲得的熱力學 信息基礎上確定在熱力學上穩定的結合序列;
在基因組上尋找所述結合序列,并定位其在基因組上的位置。
2.根據權利要求1所述的方法,其特征在于,所述索引表的熱力學信息 中的焓ΔH°通過將所述雜交結構中從起始至結束的完美匹配堿基對之間的序 列所包含的完美匹配的二聚體結構和非完美匹配結構的焓累加得到;
所述熵ΔS°通過將所述雜交結構中從起始至結束的完美匹配堿基對之間 的序列所包含的完美匹配的二聚體結構和非完美匹配結構的熵累加得到;
所述自由能通過總焓和總熵根據鹽濃度校正公 和計算得到,所述總焓通過將 所述雜交結構中所有完美匹配的二聚體結構和非完美匹配結構的焓,與起始 和結束單獨堿基對GC或AT的焓以及序列對稱性的焓累加得到,所述總熵通 過將所述雜交結構中所有完美匹配的二聚體結構和非完美匹配結構的熵,與 起始和結束單獨堿基對GC或AT的熵以及序列對稱性的熵累加得到,
使五進制數中的0、1、2、3分別對應四種脫氧核糖核酸中的一種,4對 應空位gap,將所述7-mer寡核苷酸與其所有結合序列中的DNA序列碼轉換 為五進制數,然后將該五進制數轉換為十進制數。
3.根據權利要求1或2所述的方法,其特征在于,利用所述索引表獲取 待推斷寡核苷酸的熱力學信息,并在獲得的熱力學信息基礎上確定在熱力學 上穩定的結合序列包括:
將待推斷寡核苷酸以7-mer的長度自5'端方向至3'端進行分割,得到長 度為7-mer的寡核苷酸片段和/或長度小于7-mer的寡核苷酸片段;
對于長度為7-mer的寡核苷酸片段,其熱力學信息通過查找上述索引表 獲得,對于長度小于7-mer的寡核苷酸片段,其熱力學信息通過重新構建獲 得;
將各分割得到的寡核苷酸片段的熱力學信息進行組合,并將每個組合中 的各項熱力學信息進行加和,得到待推斷寡核苷酸的熱力學信息;
根據待推斷寡核苷酸的熱力學信息中的自由能的大小,確定所述待推斷 寡核苷酸在熱力學上穩定的結合序列。
4.根據權利要求1所述的方法,其特征在于,在基因組上尋找所述結合 序列,并定位它們在基因組上的位置包括:
根據9-mer索引算法構建基因組中任意9-mer序列,從5’端至3’端方 向,在正義鏈和反義鏈的位置信息;
在基因組上定位已獲得的待推斷寡核苷酸在熱力學上穩定的結合序列。
5.根據權利要求3所述的方法,其特征在于,長度為7-mer寡核苷酸片 段的熱力學信息通過查找上述索引表獲得包括:
使五進制數中的0、1、2、3分別對應四種脫氧核糖核酸中的一種,4對 應空位gap,將分割待推斷寡核苷酸得到的7-mer寡核苷酸片段的DNA序列 碼轉換五進制數,然后將該五進制數轉換為十進制數,
查找所述7-mer寡核苷酸片段的十進制數在所述索引表中對應的熱力學 信息即得到該7-mer寡核苷酸片段的熱力學信息。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國人民解放軍軍事醫學科學院放射與輻射醫學研究所;北京云醫國際科技有限公司,未經中國人民解放軍軍事醫學科學院放射與輻射醫學研究所;北京云醫國際科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201410568387.0/1.html,轉載請聲明來源鉆瓜專利網。
- 同類專利
- 專利分類
G06F 電數字數據處理
G06F19-00 專門適用于特定應用的數字計算或數據處理的設備或方法
G06F19-10 .生物信息學,即計算分子生物學中的遺傳或蛋白質相關的數據處理方法或系統
G06F19-12 ..用于系統生物學的建模或仿真,例如:概率模型或動態模型,遺傳基因管理網絡,蛋白質交互作用網絡或新陳代謝作用網絡
G06F19-14 ..用于發展或進化的,例如:進化的保存區域決定或進化樹結構
G06F19-16 ..用于分子結構的,例如:結構排序,結構或功能關系,蛋白質折疊,結構域拓撲,用結構數據的藥靶,涉及二維或三維結構的
G06F19-18 ..用于功能性基因組學或蛋白質組學的,例如:基因型–表型關聯,不均衡連接,種群遺傳學,結合位置鑒定,變異發生,基因型或染色體組的注釋,蛋白質相互作用或蛋白質核酸的相互作用





