[發明專利]RNA二級結構預測方法及系統在審
| 申請號: | 202210546028.X | 申請日: | 2022-05-19 |
| 公開(公告)號: | CN114822692A | 公開(公告)日: | 2022-07-29 |
| 發明(設計)人: | 沈家全;張永新;徐成路;李德光;張斌斌;付苗苗;李男杰;李純旭;王世同 | 申請(專利權)人: | 洛陽師范學院 |
| 主分類號: | G16B25/10 | 分類號: | G16B25/10;G06N3/00 |
| 代理公司: | 北京睿智保誠專利代理事務所(普通合伙) 11732 | 代理人: | 杜娟 |
| 地址: | 471934 河南省*** | 國省代碼: | 河南;41 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | rna 二級 結構 預測 方法 系統 | ||
本發明公開了一種RNA二級結構預測方法及系統,涉及生物信息學領域。本發明包括以下步驟:獲取RNA數據樣本,并讀取RNA樣本序列;構建螺旋區點陣圖;根據螺旋區點陣圖構建初始莖區池;利用莖區池構建初始種群;在初始種群的基礎之上,對RNA的種子進行能量計算,交叉,變異,莖區替換等操作,得到RNA種子自由能值,莖的位置和長度,環的種類和個數,多分支環和發夾環的位置以及發夾環長度,RNA中未配對的自由堿基單鏈的長度以及位置。本發明對于RNA進行二級結構預測有著合理的空間復雜度,以及較高的準確性,使得能量計算和結構預測時擁有更快的效率。
技術領域
本發明涉及生物信息學領域,更具體的說是涉及一種RNA二級結構預測方法及系統。
背景技術
伴隨著生物信息學的發展,以及人們對基因研究的深入,RNA已經不再僅僅是從DNA到蛋白質的“信使”。在生命活動中,RNA表現出來的重要地位,讓人們開始重新關注和重視RNA所引起的各種生物化學功能,因此研究透徹RNA的二級結構,可以幫助我們更準確的預測蛋白質的結構。不同的生物學也從RNA二級結構中發現了獨特的計算模型,RNA的結構知識為醫學藥物開發也提供了重要的基礎,這一領域獲得了大家越來越多的重視并且人們已經將一些RNA二級結構的折疊算法用于生物制藥中。我們已經知道RNA的功能與其結構息息相關,密不可分,RNA的結構決定著RNA的功能,當然,我們也不能忽略掉RNA中可能存在的假結結構對一些重要的生物功能產生的重要影響。考慮到假結結構的特殊性和難解性,帶假結的RNA二級結構預測算法也已成為RNA二級結構預測算法研究中的重難點。
發明內容
有鑒于此,本發明提供了一種RNA二級結構預測方法及系統,以解決上述技術問題。
為了實現上述目的,本發明采用如下技術方案:
一種RNA二級結構預測方法,包括以下步驟:
獲取RNA數據樣本,并讀取RNA序列;
構建螺旋區點陣圖;
根據螺旋區點陣圖構建初始莖區池;
利用莖區池構建初始種群;
在初始種群的基礎之上,對RNA的種子進行能量計算,交叉,變異,莖區替換操作,得到RNA種子自由能值,莖的位置和長度,環的種類和個數,多分支環和發夾環的位置以及發夾環長度,RNA中未配對的自由堿基單鏈的長度以及位置。
可選的,所述螺旋區點陣圖的構建規則如下:針對長度為n的RNA序列,構建n*n的螺旋區點陣矩陣,如果RNA序列中的堿基對是Watson crick堿基對或者Wobble堿基對時,則螺旋區點陣矩陣中相應位置的矩陣值為1,否則矩陣值賦值為0。
可選的,構建初始莖區池的步驟如下:按照45°反對角線方向遍歷整個螺旋區點陣矩陣,得到所有可能的莖區,將所有可能的莖區存放于數組stem[s]中,形成初始莖區池,并對莖區池中所有莖區進行能量計算,存儲于莖區池中。
可選的,構建初始種群的步驟如下:隨機選擇若干莖區組成一個種子,將種子內部莖區按照莖區開始位置排序,判斷排序后的莖區是否存在交叉,若有交叉則刪除交叉莖區,并填補刪除的莖區,多次重復,直至沒有交叉。重復上述步驟,形成大規模初始種群。
可選的,還包括將形成的初始種群輸出測試,測試步驟如下:對初始種群中的每一個種子的莖區進行檢測,判斷種子內部莖區是否有交叉,如果有交叉,則種群隨機生成模塊不正確,如果沒有交叉,說明正確。
可選的,變異操作的具體步驟如下:
交叉完成之后,對種群按照個體自由能大小進行排序;
將種子個體中的莖區按自由能從小到大排序;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于洛陽師范學院,未經洛陽師范學院許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202210546028.X/2.html,轉載請聲明來源鉆瓜專利網。





