[發明專利]一種突變蛋白的檢測方法及裝置有效
| 申請號: | 201710429915.8 | 申請日: | 2017-06-09 |
| 公開(公告)號: | CN107403074B | 公開(公告)日: | 2018-05-29 |
| 發明(設計)人: | 張耀洲;馮建華;吳玉乾;張樹軍;李冬梅;焦春彬;陳玉皎;胖鐵良;王文雅 | 申請(專利權)人: | 天津市湖濱盤古基因科學發展有限公司 |
| 主分類號: | G06F19/18 | 分類號: | G06F19/18;G06F19/28 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 300300 天津市*** | 國省代碼: | 天津;12 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 氨基酸序列 比對結果 比對 蛋白數據庫 線粒體序列 突變蛋白 線粒體 轉錄組 氨基酸 同源 檢測 突變 數據庫 蛋白 核苷酸序列轉化 輸出 轉化 | ||
1.一種突變蛋白的檢測方法,其特征在于,包括:
獲取樣品對應的轉錄組數據;
將所述轉錄組數據與線粒體數據庫進行比對,根據與線粒體數據庫的比對結果輸出非線粒體序列;其中,線粒體數據庫中包括若干條線粒體數據;
將非線粒體序列中的核苷酸序列轉化成氨基酸序列,并將轉化后的氨基酸序列與蛋白數據庫進行比對,并在與蛋白數據庫的比對結果中提取同源率在第一設定范圍內、且氨基酸長度在第二設定范圍內的氨基酸序列;
將提取的同源率在第一設定范圍內、且氨基酸長度在第二設定范圍內的氨基酸序列與NCBI進行比對,根據與NCBI的比對結果確定發生了突變的蛋白;
所述將所述轉錄組數據與線粒體數據庫進行比對,根據與線粒體數據庫的比對結果輸出非線粒體序列,包括:針對所述轉錄組數據在線粒體數據庫中進行遍歷,若未遍歷到所述轉錄組數據,則將所述轉錄組數據作為非線粒體序列輸出。
2.根據權利要求1所述的突變蛋白的檢測方法,其特征在于,所述根據與NCBI的比對結果確定發生了突變的蛋白,包括:
確定樣品對應的目標物種;
確定與NCBI的比對結果中氨基酸序列與所述目標物種的同源率,以及確定與NCBI的比對結果中氨基酸序列與除所述目標物種之外的其他物種的同源率;
在與所述目標物種的同源率不小于與所述其他物種的同源率時,將與所述目標物種的同源率未處于第三設定范圍內的氨基酸序列確定為發生了突變的蛋白;
在與所述目標物種的同源率小于與所述其他物種的同源率時,將與NCBI比對的所有氨基酸序列均確定為發生了突變的蛋白。
3.根據權利要求2所述的突變蛋白的檢測方法,其特征在于,所述第三設定范圍為:99%-100%。
4.根據權利要求1所述的突變蛋白的檢測方法,其特征在于,所述獲取樣品對應的轉錄組數據,包括:
采集用于檢測的組織或血液作為樣品,并在采集的組織或血液中提取RNA;
將提取的RNA進行反轉錄成cDNA,并將所述cDNA擴增為雙鏈DNA;
對所述雙鏈DNA進行建庫處理,利用單分子測序儀對建庫處理后的所述雙鏈DNA進行單分子測序,從所述單分子測序儀中拷貝出測序后的轉錄組數據。
5.根據權利要求1所述的突變蛋白的檢測方法,其特征在于,在所述將提取的同源率在第一設定范圍內、且氨基酸長度在第二設定范圍內的氨基酸序列與NCBI進行比對之前,進一步包括:
獲取包括有同源率在第一設定范圍內、且氨基酸長度在第二設定范圍內的氨基酸序列的比對報告,根據所述比對報告將插入或缺失的氨基酸個數在第四設定范圍內的氨基酸序列篩選出來,并根據篩選出來的氨基酸序列執行所述與NCBI進行比對的操作。
6.根據權利要求5所述的突變蛋白的檢測方法,其特征在于,所述第四設定范圍為不小于5個氨基酸。
7.根據權利要求1所述的突變蛋白的檢測方法,其特征在于,在所述根據與NCBI的比對結果確定發生了突變的蛋白之后,進一步包括:
確定發生了突變的蛋白對應的參考蛋白結構;
預測出發生了突變的蛋白對應的目標蛋白結構;
將所述目標蛋白結構與所述參考蛋白結構進行各方位視圖的比對,并對每一方位視圖對應比對結果中的突變位置進行標識;
根據每一方位視圖對應比對結果中標識的突變位置進一步驗證確定為發生了突變的蛋白是否發生了突變。
8.根據權利要求1所述的突變蛋白的檢測方法,其特征在于,進一步包括:對確定為發生了突變的蛋白進行蛋白通路注釋。
9.根據權利要求1-8中任一所述的突變蛋白的檢測方法,其特征在于,
所述第一設定范圍為:50%-97%;
和/或,
所述第二設定范圍為:不小于70個氨基酸。
10.一種突變蛋白的檢測裝置,其特征在于,包括:
獲取單元,用于獲取樣品對應的轉錄組數據;
第一比對單元,用于將所述轉錄組數據與線粒體數據庫進行比對,根據與線粒體數據庫的比對結果輸出非線粒體序列;其中,線粒體數據庫中包括若干條線粒體數據;
轉化單元,用于將非線粒體序列中的核苷酸序列轉化成氨基酸序列;
第二比對單元,用于將轉化后的氨基酸序列與蛋白數據庫進行比對;
提取單元,用于在與蛋白數據庫的比對結果中提取同源率在第一設定范圍內、且氨基酸長度在第二設定范圍內的氨基酸序列;
第三比對單元,用于將提取的同源率在第一設定范圍內、且氨基酸長度在第二設定范圍內的氨基酸序列與NCBI進行比對,根據與NCBI的比對結果確定發生了突變的蛋白;
所述第一比對單元,具體用于針對所述轉錄組數據在線粒體數據庫中進行遍歷,若未遍歷到所述轉錄組數據,則將所述轉錄組數據作為非線粒體序列輸出。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于天津市湖濱盤古基因科學發展有限公司,未經天津市湖濱盤古基因科學發展有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710429915.8/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種心臟二尖瓣流場域數值模擬方法
- 下一篇:DNA序列的處理方法及設備
- 同類專利
- 專利分類
G06F 電數字數據處理
G06F19-00 專門適用于特定應用的數字計算或數據處理的設備或方法
G06F19-10 .生物信息學,即計算分子生物學中的遺傳或蛋白質相關的數據處理方法或系統
G06F19-12 ..用于系統生物學的建模或仿真,例如:概率模型或動態模型,遺傳基因管理網絡,蛋白質交互作用網絡或新陳代謝作用網絡
G06F19-14 ..用于發展或進化的,例如:進化的保存區域決定或進化樹結構
G06F19-16 ..用于分子結構的,例如:結構排序,結構或功能關系,蛋白質折疊,結構域拓撲,用結構數據的藥靶,涉及二維或三維結構的
G06F19-18 ..用于功能性基因組學或蛋白質組學的,例如:基因型–表型關聯,不均衡連接,種群遺傳學,結合位置鑒定,變異發生,基因型或染色體組的注釋,蛋白質相互作用或蛋白質核酸的相互作用





