[發(fā)明專利]一種RNA結(jié)構(gòu)比對方法在審
| 申請?zhí)枺?/td> | 201810039783.2 | 申請日: | 2018-01-16 |
| 公開(公告)號: | CN108334748A | 公開(公告)日: | 2018-07-27 |
| 發(fā)明(設計)人: | 劉士勇;鄭進芳 | 申請(專利權)人: | 華中科技大學 |
| 主分類號: | G06F19/18 | 分類號: | G06F19/18;G06F19/22 |
| 代理公司: | 華中科技大學專利中心 42201 | 代理人: | 許恒恒;李智 |
| 地址: | 430074 湖北*** | 國省代碼: | 湖北;42 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 比對 比對結(jié)果 核苷酸 矩陣 相似性分數(shù) 空間距離 三級結(jié)構(gòu) 序列比對 方差 疊加 收斂 引入 統(tǒng)一 | ||
1.一種RNA結(jié)構(gòu)比對方法,其特征在于,包括以下步驟:
(1)將比對RNA和被比對RNA進行序列比對,得到初始序列比對結(jié)果,使用疊加算法計算所述初始序列比對結(jié)果,得到平移向量和旋轉(zhuǎn)矩陣R;
(2)將步驟(1)得到的平移向量和旋轉(zhuǎn)矩陣R根據(jù)作用到被比對RNA原始結(jié)構(gòu)上后,與比對RNA進行疊加形成疊加好的結(jié)構(gòu)A1;所述指的是被比對RNA的空間坐標;
(3)將步驟(2)得到的疊加好的結(jié)構(gòu)A1根據(jù)公式得到距離矩陣S(i,j);其中dij是比對RNA核苷酸序列的第i個堿基和被比對RNA核苷酸序列的第j個堿基的距離;其中d0由公式計算得到,LN指的是比對RNA和被比對RNA片段的平均核苷酸個數(shù),A、B、C、D、E和F是任意正數(shù);
(4)將步驟(3)得到的距離矩陣作為打分矩陣,并將比對RNA和被比對RNA進行序列比對,得到第一序列比對結(jié)果;
(5)將步驟(4)中得到的第一序列比對結(jié)果使用RMscore打分過程進行打分,得到最大的RMscore分數(shù)以及對應的旋轉(zhuǎn)矩陣R1;所述RMscore打分過程包括以下步驟:
(S1)選取步驟(4)中所述第一序列比對結(jié)果中比對上的核苷酸對片段,所述片段至少含有3對連續(xù)的比對上的核苷酸對,將所述片段的核苷酸對質(zhì)心均移動到原點,將疊加算法運用到質(zhì)心移動到原點的片段上,得到旋轉(zhuǎn)矩陣R2;
(S2)根據(jù)的方式作用到被比對RNA原始結(jié)構(gòu)上后,與比對RNA形成疊加好的結(jié)構(gòu)A2;所述是被比對的RNA空間坐標;
(S3)根據(jù)步驟(S2)得到疊加好的結(jié)構(gòu)A2,計算出比對上的核苷酸對中距離小于的核苷酸對;
(S4)將步驟(S3)得到的距離小于的核苷酸對使用疊加算法進行疊加得到旋轉(zhuǎn)矩陣R3,根據(jù)的方式作用到被比對RNA原始結(jié)構(gòu)上后,與比對RNA形成疊加好的結(jié)構(gòu)A3,計算出比對上的并且距離小于的核苷酸對;所述是被比對的RNA空間坐標;
(S5)判斷步驟(S4)得到的旋轉(zhuǎn)矩陣R3和步驟(S1)得到的旋轉(zhuǎn)矩陣R2的差別,若差別不超過0.0001,那么進入步驟(S6);若差別超過0.0001,將R2更新為R3,然后重復步驟(S2)-步驟(S4),得到更新后的R3,直到更新的R2和更新后的R3的差別不超過0.0001;
(S6)取步驟(S5)中差別不超過0.0001的更新的R2和更新后的R3之間的任意值作為收斂旋轉(zhuǎn)矩陣R4,根據(jù)的方式作用到被比對RNA原始結(jié)構(gòu)上后,與比對RNA形成疊加好的結(jié)構(gòu)A4;所述是被比對的RNA空間坐標;
(S7)根據(jù)公式計算步驟(S6)所述的疊加好的片段結(jié)構(gòu)A4的RMscore分數(shù),其中LN指的是比對RNA和被比對RNA片段的平均核苷酸個數(shù),LT指的是比對上的核苷酸對數(shù),di是疊加好的結(jié)構(gòu)中比對上的核苷酸之間的距離;所述d0是由公式計算得到,其中LN指的是比對RNA和被比對RNA片段的平均核苷酸個數(shù),G、H、I、J、K和L是任意正數(shù);
(S8)更換步驟(S1)所述比對上的核苷酸對片段,直至所述片段取遍所有至少含有3對連續(xù)的比對上的核苷酸對,重復步驟(S1)-(S7),得到不同的RMscore分數(shù),取其中最大的RMscore分數(shù)以及對應的旋轉(zhuǎn)矩陣R1;
(6)根據(jù)的方式作用到被比對RNA原始結(jié)構(gòu)上后,與比對RNA形成疊加的結(jié)構(gòu)A5;所述是被比對的RNA空間坐標;將疊加好的結(jié)構(gòu)A5根據(jù)公式得到距離矩陣S(i,j);其中dij是比對RNA核苷酸序列的第i個堿基和被比對RNA核苷酸序列的第j個堿基的距離;其中d0由公式計算得到,LN指的是比對RNA和被比對RNA片段的平均核苷酸個數(shù),M、N、P、Q、R和S是任意正數(shù);
(7)將步驟(6)得到的距離矩陣作為打分矩陣,并將比對RNA和被比對RNA進行序列比對,得到第二序列比對結(jié)果;
(8)判斷步驟(7)得到的第二序列比對結(jié)果和步驟(4)得到的第一序列比對結(jié)果是否一致;若一致,那么進入步驟(9);若不一致,那么將步驟(7)中的第二序列比對結(jié)果作為步驟(4)中的第一序列比對結(jié)果,然后重復步驟(5)-步驟(7),直到步驟(7)得到的第二序列比對結(jié)果和步驟(4)得到的第一序列比對結(jié)果一致;該結(jié)果即為最終序列比對結(jié)果;
(9)將步驟(8)中的最終序列比對結(jié)果使用RMscore打分過程進行打分,得到最大的RMscore分數(shù)和相對應的旋轉(zhuǎn)矩陣R5,根據(jù)的方式作用到被比對RNA原始結(jié)構(gòu)上后,與比對RNA形成疊加好的結(jié)構(gòu)A6;所述是被比對的RNA空間坐標;
(10)步驟(8)中得到的最終序列比對結(jié)果以及步驟(9)中得到的最大的RMscore分數(shù)和疊加好的結(jié)構(gòu)A6即為最終的比對結(jié)果。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于華中科技大學,未經(jīng)華中科技大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810039783.2/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06F 電數(shù)字數(shù)據(jù)處理
G06F19-00 專門適用于特定應用的數(shù)字計算或數(shù)據(jù)處理的設備或方法
G06F19-10 .生物信息學,即計算分子生物學中的遺傳或蛋白質(zhì)相關的數(shù)據(jù)處理方法或系統(tǒng)
G06F19-12 ..用于系統(tǒng)生物學的建模或仿真,例如:概率模型或動態(tài)模型,遺傳基因管理網(wǎng)絡,蛋白質(zhì)交互作用網(wǎng)絡或新陳代謝作用網(wǎng)絡
G06F19-14 ..用于發(fā)展或進化的,例如:進化的保存區(qū)域決定或進化樹結(jié)構(gòu)
G06F19-16 ..用于分子結(jié)構(gòu)的,例如:結(jié)構(gòu)排序,結(jié)構(gòu)或功能關系,蛋白質(zhì)折疊,結(jié)構(gòu)域拓撲,用結(jié)構(gòu)數(shù)據(jù)的藥靶,涉及二維或三維結(jié)構(gòu)的
G06F19-18 ..用于功能性基因組學或蛋白質(zhì)組學的,例如:基因型–表型關聯(lián),不均衡連接,種群遺傳學,結(jié)合位置鑒定,變異發(fā)生,基因型或染色體組的注釋,蛋白質(zhì)相互作用或蛋白質(zhì)核酸的相互作用





