[發明專利]一種circRNA的識別方法及裝置有效
| 申請號: | 201811341102.4 | 申請日: | 2018-11-12 |
| 公開(公告)號: | CN109448795B | 公開(公告)日: | 2021-04-16 |
| 發明(設計)人: | 孫曉勇;魏慶功;尹猛 | 申請(專利權)人: | 山東農業大學 |
| 主分類號: | G16B40/00 | 分類號: | G16B40/00;G16B25/10;G06N3/04 |
| 代理公司: | 濟南圣達知識產權代理有限公司 37221 | 代理人: | 張慶騫 |
| 地址: | 271018 *** | 國省代碼: | 山東;37 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 circrna 識別 方法 裝置 | ||
本公開提供了一種circRNA的識別方法及裝置。其中,一種circRNA的識別方法,包括:從已確定的circRNA序列和非circRNA序列中分別提取預設數量的堿基序列;對提取的堿基序列進行編碼,形成circRNA序列數據集和非circRNA序列數據集;將circRNA序列數據集和非circRNA序列數據集混合后,輸入至circRNA識別模型中,訓練得到最優circRNA識別模型;將待測堿基序列輸入至最優circRNA識別模型,輸出預測結果。
技術領域
本公開屬于circRNA識別領域,尤其涉及一種circRNA的識別方法及裝置。
背景技術
本部分的陳述僅僅是提供了與本公開相關的背景技術信息,不必然構成在先技術。
circRNA(環狀RNA),其中文全稱為環狀核糖核酸,由磷酸、核糖和堿基構成。circRNA是一類特殊的非編碼RNA分子。與傳統的線性RNA(linear RNA,含5’和3’末端)不同,circRNA分子呈封閉環狀結構,不受RNA外切酶影響,表達更穩定,不易降解。在功能上,近年的研究表明,circRNA分子富含microRNA(miRNA)結合位點,在細胞中起到miRNA海綿(miRNA sponge)的作用,進而解除miRNA對其靶基因的抑制作用,升高靶基因的表達水平;這一作用機制被稱為競爭性內源RNA(ceRNA)機制。通過與疾病關聯的miRNA相互作用,circRNA在疾病中發揮著重要的調控作用。
在測序下機數據查找circRNA的方法主要有5種,即find_circ,circRNA_finder,CIRI,circExplorer,MapSplice。上述方法的原理都是基于識別在測序數據中由于circRNA的環狀結構而形成的反向剪接信號。發明人發現由于跨過剪接位點的反向剪接序列在全部測序數據中的含量極低,傳統查找circRNA的方法在計算circRNA的表達水平上存在可靠性差的缺陷。
發明內容
根據本公開的一個或多個實施例的一個方面,提供一種circRNA的識別方法,其能夠提高circRNA識別準確率且降低circRNA的識別時間。
本公開提供的一種circRNA的識別方法,包括:
從已確定的circRNA序列和非circRNA序列中分別提取預設數量的堿基序列;
對提取的堿基序列進行編碼,形成circRNA序列數據集和非circRNA序列數據集;
將circRNA序列數據集和非circRNA序列數據集混合后,輸入至circRNA識別模型中,訓練得到最優circRNA識別模型;
將待測堿基序列輸入至最優circRNA識別模型,輸出預測結果。
在一個或多個實施例中,從已確定的circRNA序列中提取預設數量的堿基序列的過程,包括:
以circRNA序列的accept端點為中心提取預設個數的堿基序列;
以circRNA序列的donor端點為中心提取預設個數的堿基序列。
在一個或多個實施例中,從已確定的非circRNA序列中提取預設數量的堿基序列的過程,包括:
隨機選擇非circRNA序列的accept端點和donor端點;
以非circRNA序列的accept端點為中心提取預設個數的堿基序列;
以非circRNA序列的donor端點為中心提取預設個數的堿基序列。
在一個或多個實施例中,對提取的堿基序列進行編碼的過程,包括:
對堿基序列進行one-hot編碼;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于山東農業大學,未經山東農業大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811341102.4/2.html,轉載請聲明來源鉆瓜專利網。





