[發明專利]lncRNA靶基因的預測分析方法、裝置、設備和介質在審
| 申請號: | 202011294079.5 | 申請日: | 2020-11-18 |
| 公開(公告)號: | CN112201304A | 公開(公告)日: | 2021-01-08 |
| 發明(設計)人: | 馬貝貝;黃龍 | 申請(專利權)人: | 上海美吉生物醫藥科技有限公司 |
| 主分類號: | G16B20/00 | 分類號: | G16B20/00 |
| 代理公司: | 上海光華專利事務所(普通合伙) 31219 | 代理人: | 李治東 |
| 地址: | 201321 上海市浦東新區中國(上海)*** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | lncrna 基因 預測 分析 方法 裝置 設備 介質 | ||
本申請提供的一種lncRNA靶基因的預測分析方法、裝置、設備和介質,通過統計每個處理中重復的mRNA表達量之和,并根據表達量過濾掉表達量之和為零的mRNA序列;對mRNA和lncRNA的表達量進行相關性分析,并提取對應的相關性系數和概率P值作為相關性評判標準,以合并去冗余并分別以mRNA文件和lncRNA文件進行存儲;對去冗余后的lncRNA序列按照指定序列數目進行拆分,以分別生成批量任務運行shell腳本,并提交至集群以實現多線程運行。本申請設置過濾方法減少lncRNA待預測的靶基因數量,減少了lncRNA靶基因預測假陽性率,從去除假陽性和多線程角度優化提升lncRNA靶基因預測效率。
技術領域
本發明涉及基因預測技術領域,特別是涉及一種lncRNA靶基因的預測分析方法、裝置、設備和介質。
背景技術
lncRNA是一種序列長度大于200bp的長鏈非編碼RNA序列,以RNA方式結合DNA及轉錄翻譯中間產物,然后參與調控轉錄干擾、轉錄激活、蛋白表達等多個重要生物過程。現有研究對lncRNA調控模式的探索尚無重要發現。因此,lncRNA靶基因預測目前成為lncRNA功能性研究的關鍵。
預測方法是對已預測的lncRNA序列錨定其特定mRNA作為該lncRNA的靶基因,然后通過靶基因功能對lncRNA功能定性注釋。基于此,lncRNA靶基因的精確定位成為lncRNA研究的一項重要內容,而準確高效的靶基因預測成為生物信息技術上的關鍵。
目前lnRNA靶基因預測分為cis作用靶基因預測和trans作用靶基因預測兩種主要方向。cis作用靶基因預測是對lncRNA上下游一定范圍內共表達蛋白編碼基因的預測和功能富集;而trans靶基因預測是基于共表達和序列相似度對lncRNA靶基因預測。兩種預測的差異在于是否基于距離算法,trans靶基因預測中認為靶基因與lncRNA位置不相關。
但是,序列相似度分析是基于能量值計算,需要對序列間相似度進行比對,運算量很大。目前基于能量值的已有lncRNA預測軟件預測速度均較慢,預測時間隨序列數呈線性增加,根據近期研究結果表明,基于算法優化上的lncRNA預測速度提升已達到瓶頸狀態,trans靶基因預測基于序列相似度的評估的算法的預測速度較慢,使得預測效率上存在限制;另外,基于表達量相關性的預測分析準確度相對降低。僅從統計學方法上,對兩個基因的表達量進行相關性分析,在表達量較低的基因中容易出現假陽性。
發明內容
鑒于以上所述現有技術的缺點,本申請的目的在于提供一種lncRNA靶基因的預測分析方法、裝置、設備和介質,以解決現有技術中的問題。
為實現上述目的及其他相關目的,本申請提供一種lncRNA靶基因的預測分析方法,所述方法包括:統計每個處理中重復的mRNA表達量之和,并根據表達量過濾掉表達量之和為零的mRNA序列;對mRNA和lncRNA的表達量進行相關性分析,并提取對應的相關性系數和概率P值作為相關性評判標準,以合并去冗余并分別以mRNA文件和lncRNA文件進行存儲;對去冗余后的lncRNA序列按照指定序列數目進行拆分,以分別生成批量任務運行shell腳本,并提交至集群以實現多線程運行。
于本申請的一實施例中,所述對mRNA和lncRNA的表達量進行相關性分析中,根據樣本數量的不同選擇不同的相關性分析方法。
于本申請的一實施例中,所述根據樣本數量的不同選擇不同的相關性分析方法,包括:若樣本數量小于15,則通過R軟件包Hmsic中的rcorr函數對mRNA和lncRNA的表達量進行相關性分析;反之,若樣本數量大于15,則通過加權共表達網絡分析對mRNA和lncRNA的表達量進行相關性分析。
于本申請的一實施例中,所述提取對應的相關性系數和概率P值作為相關性評判標準,包括:默認提取P0.05的基因,將關聯基因合并去冗余后分別以mRNA和lncRNA儲存。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于上海美吉生物醫藥科技有限公司,未經上海美吉生物醫藥科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011294079.5/2.html,轉載請聲明來源鉆瓜專利網。





