[發明專利]基因表達的定量方法及裝置有效
| 申請號: | 201410108121.8 | 申請日: | 2014-03-21 |
| 公開(公告)號: | CN103902852B | 公開(公告)日: | 2017-03-22 |
| 發明(設計)人: | 黃文潘;盧志遠;龔梅花;章文蔚;席鳳;韓鴻雁 | 申請(專利權)人: | 深圳華大基因科技有限公司 |
| 主分類號: | G06F19/20 | 分類號: | G06F19/20 |
| 代理公司: | 深圳鼎合誠知識產權代理有限公司44281 | 代理人: | 彭愿潔,彭家恩 |
| 地址: | 518083 廣東省深圳市鹽田*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基因 表達 定量 方法 裝置 | ||
技術領域
本發明涉及基因組學及生物信息學技術領域,具體涉及一種基因表達的定量方法及裝置。
背景技術
轉錄組測序技術(RNA-seq,RNA?sequencing)是把小RNA(Ribonucleic?Acid,核糖核酸)、mRNA和非編碼RNA等或者其中一些用高通量測序技術把它們的序列測出來。目前RNA-seq測序平臺有多種,包括Hiseq、Roche?FLX、Illumina?Solexa、ABI?solid等。不同測序平臺的測序原理有所不同,但測序步驟基本包括文庫制備,聚合酶鏈式反應(PCR,Polymerase?Chain?Reaction)擴增等。通過RNA-seq,科研工作者能夠獲得生物中基因表達的情況,研究不同個體、不同時期、不同形態的組織的基因表達水平的差異。
中國專利申請(申請號:201110283718.2,名稱:一種分析基因表達定量的方法)基于Illumina平臺公開一種分析基因表達定量的方法,可以克服數字基因表達譜(DGE,Digital?Gene?Expression)技術對CATG位點和參考基因完整性依賴性強的缺點。但是,該方法測序分析需時較長,勞動效率有待提高。
發明內容
本發明提供一種基因表達的定量方法及裝置,可以快速地完成基因表達的定量。
依據本發明的一方面提供一種基因表達的定量方法,包括:獲取含有核酸序列信息的讀段序列;將讀段序列與所有參考基因進行比對,獲取比對上的讀段序列;對比對上的讀段序列進行過濾,舍去軟剪切比例超過第一預設值,序列長度小于第二預設值,以及比對得分小于第三預設值的讀段序列,軟剪切比例是指沒有比對上的堿基數目占該讀段序列總堿基數目的比例;比對得分是按照每個讀段序列與參考基因的匹配程度以及讀段序列的長度而確定的數值;對于已過濾的讀段序列,使用每百萬讀段序列中來自目標基因每千堿基長度的讀段序列數目RPKM對所述目標基因表達進行定量,定義為RPKM=(比對到目標基因對應的參考基因的讀段序列的數目)*109/(比對到所有參考基因的讀段序列的數目*目標基因的長度)。
優選地,比對到目標基因對應的參考基因的讀段序列的數目是指只能比對到目標基因對應的參考基因上,而且能夠比對到所述參考基因的至少一個轉錄本的讀段序列的數目;目標基因的長度是指目標基因的所有轉錄本中最長的轉錄本的長度。
依據本發明的另一方面提供一種基因表達的定量裝置,包括:數據輸入單元,用于輸入數據;數據輸出單元,用于輸出數據;存儲單元,用于存儲數據,其中包括可執行的程序;處理器,與數據輸入單元、數據輸出單元及存儲單元數據連接,用于執行存儲單元中存儲的可執行的程序,該程序的執行包括完成上述基因表達的定量方法。
本發明的有益效果是:通過將讀段序列與參考基因進行比對,而不是現有的與參考基因組進行比對,可以簡化比對過程,提高比對效率。特別地,比對到目標基因對應的參考基因的讀段序列的數目是指只能比對到目標基因對應的參考基因上,而且能夠比對到所述參考基因的至少一個轉錄本的讀段序列的數目,則不會認為這部分讀段序列是重復比對而需要被過濾,從而提高RPKM和QPCR的相關性,即提高基因表達定量的準確性。
附圖說明
圖1為現有技術中RNA-seq的流程圖;
圖2為本發明實施例一的流程圖(A);
圖3為本發明實施例一的流程圖(B);
圖4為本發明實施例一的讀段序列選擇示意圖;
圖5是本發明實施例一的HBRR標準品和QPCR標準的相關性結果圖;
圖6是本發明實施例一的HBRR標準品的重復性結果圖。
具體實施方式
下面通過具體實施方式結合附圖對本發明作進一步詳細說明。
現有的高通量測序平臺有多種,包括Roche454,Ion?PGM和Ion?Proton等。本發明中的實施例以Ion?Proton測序平臺作說明,其他測序平臺亦同樣適用本發明所提供的方法,測序平臺并不構成本發明的限制。RNA樣本的文庫構建一般包括將RNA反轉錄為DNA來進行文庫構建,RNA的提取、構建文庫等均可利用現有技術進行,測序文庫構建步驟一般包括打斷、末端修復、加proton接頭、擴增等,請參考圖1,測序步驟及參數可以根據不同測序平臺的建議操作說明、測試樣本種類進行調整,不構成對本發明的限制。實施例中未注明具體條件的,按照常規條件或制造商建議的條件進行;所用試劑或儀器未注明生產廠商的,均為可以通過市面購買獲得的常規產品。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于深圳華大基因科技有限公司,未經深圳華大基因科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201410108121.8/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種彩色涂層壓花鋁板
- 下一篇:端部無粘結鋼筋混凝土柱及制備方法
- 同類專利
- 專利分類
G06F 電數字數據處理
G06F19-00 專門適用于特定應用的數字計算或數據處理的設備或方法
G06F19-10 .生物信息學,即計算分子生物學中的遺傳或蛋白質相關的數據處理方法或系統
G06F19-12 ..用于系統生物學的建模或仿真,例如:概率模型或動態模型,遺傳基因管理網絡,蛋白質交互作用網絡或新陳代謝作用網絡
G06F19-14 ..用于發展或進化的,例如:進化的保存區域決定或進化樹結構
G06F19-16 ..用于分子結構的,例如:結構排序,結構或功能關系,蛋白質折疊,結構域拓撲,用結構數據的藥靶,涉及二維或三維結構的
G06F19-18 ..用于功能性基因組學或蛋白質組學的,例如:基因型–表型關聯,不均衡連接,種群遺傳學,結合位置鑒定,變異發生,基因型或染色體組的注釋,蛋白質相互作用或蛋白質核酸的相互作用





