[發明專利]抗原表位構象指紋數據庫在審
| 申請號: | 201710475245.3 | 申請日: | 2017-06-21 |
| 公開(公告)號: | CN107451421A | 公開(公告)日: | 2017-12-08 |
| 發明(設計)人: | 楊家安 | 申請(專利權)人: | 南京邁格羅醫藥科技有限公司 |
| 主分類號: | G06F19/16 | 分類號: | G06F19/16;G06F19/28 |
| 代理公司: | 武漢藍寶石專利代理事務所(特殊普通合伙)42242 | 代理人: | 常海濤 |
| 地址: | 210038 江蘇省*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 抗原 構象 指紋 數據庫 | ||
技術領域
本發明涉及一種抗原表位構象指紋數據庫,屬于生物信息學領域。
背景技術
抗原(Antigen)是任何可以在人體內誘發抗體,B細胞或者T細胞免疫反應的蛋白大分子。抗原表位是被免疫系統識別的抗原關鍵結構片段。因此抗原表位的表征對于設計疫苗和開發藥物具有重要意義。抗原的特異性是由抗原表位(Epitope)所決定的。抗原表位與相應淋巴細胞的抗原受體結合而激活淋巴細胞引起免疫應答。抗原表位是免疫應答和免疫反應具有特異性的物質基礎。抗原表位是外來蛋白質結構中能被自身免疫系統所識別的多肽片段。自身免疫系統的特異性識別是基于抗原表位的各種多肽片段的三維特征和特性。
由于抗原蛋白質常含有15—25個氨基酸組成的多個不連續片段的折疊構象。構象表位的精確定位極為困難。通過X射線衍射方法,實驗方法或者計算機預測方法可以確定人類B細胞抗原表位。對于B細胞表位的loop區或無規卷曲區域的小肽序列,除了三維空間的圖像和文字描述外,表位作圖方法也可以標志表位的結合區。迄今未知,全球最具權威的抗原表位數據庫(IBDE)積累了大約25萬抗原表位的多肽。目前,最困難的問題是如何有效地預測抗原表位結構,以及比較抗原表位的結構特征和確定抗原表位特異性。為了解決這些問題,我們開發了蛋白質結構指紋技術(Protein Structure Fingerprint,PSFT)。在此基礎上,依據全球已知的抗原表位氨基酸序列,建立了一個全新的抗原表位構象指紋數據庫。
發明內容
本發明所要解決的技術問題是提供一種抗原表位構象指紋數據庫。
本發明的抗原表位構象指紋數據庫,每一條抗原表位的數據包括名稱,氨基酸序列,全信息構象指紋,所述的氨基酸序列從抗原表位數據庫中獲取,所述的全信息構象指紋是對抗原表位的氨基酸序列的三維空間構象進行預測得到的構象譜帶。
從數學角度來看氨基酸,通過不同的排序,5個氨基酸可以形成不同的排列。從全部20個氨基酸中任意地提取5個氨基酸將可以形成總數為3,200,000的不同排列。每一個排列的可能折疊構象可以從全球蛋白質數據庫(PDB)獲得,然后用蛋白折疊形狀碼(PFSC)表示。在此基礎上,我們創建了一個數據庫來收集上述三百二十萬個排列的折疊構象。該全新的數據庫被命名為5AAPFSC。
本發明的數據庫中的構象譜帶,通過如下預測過程獲得:
1)從全部20個氨基酸中任意地提取5個氨基酸,形成總數為3,200,000的不同排列,每一個排列的可能折疊構象從全球蛋白質數據庫(PDB)獲得,然后用蛋白折疊形狀碼表示;創建了一個數據庫來收集上述排列及其對應的蛋白折疊形狀碼,該數據庫被命名為5AAPFSC;
2)對于抗原表位的蛋白質,沿著氨基酸序列,從N-端開始,逐步移動向C-端,依次讀取每5個連續的氨基酸,其可能具有的折疊構象從5AAPFSC數據庫直接獲得,用蛋白折疊形狀碼的字符表示;在蛋白質數據庫(PDB)中出現頻率最高的折疊構象對應的蛋白折疊形狀碼排在第一位,出現頻率第二高的折疊形狀碼排在第二位,從上到下依次形成一列,直至收集完全為止,每5個連續的氨基酸具有不同數目的折疊構象可能;
3)抗原表位的全部可能的折疊形狀碼形成一個陣列,稱為蛋白折疊構象譜帶,代表了抗原表位全部可能的折疊構象;對于每一個位點,通過其全部可能的折疊形狀碼的相互替代,可以準確地得到所有可能的構象;可能構象的總數目是全部每5個氨基酸可能折疊構象數目的連續乘積。
對于任何一個抗原表位,盡管全部可能的空間構象的數目是巨大的,但可能性高的空間構象通過出現頻率高的局域折疊構象獲得。舉例來說,可能性高的第一個空間構象是由每個位點出現頻率最高的折疊構形狀碼構成;第二個空間構象是由每個位點出現頻率第二高的折疊形狀碼構成,在沒有第二高頻率構象的位置,以頻率最高的的折疊形狀碼作為補充構成;第三個空間構象是由每個位點出現頻率第三高的折疊形狀碼組成,在沒有第三高頻率構象的位置,以頻率最高的的折疊形狀碼作為補充構成;如此類推,形成可能性較高的一系列可能的預測構象。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于南京邁格羅醫藥科技有限公司,未經南京邁格羅醫藥科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710475245.3/2.html,轉載請聲明來源鉆瓜專利網。
- 同類專利
- 專利分類
G06F 電數字數據處理
G06F19-00 專門適用于特定應用的數字計算或數據處理的設備或方法
G06F19-10 .生物信息學,即計算分子生物學中的遺傳或蛋白質相關的數據處理方法或系統
G06F19-12 ..用于系統生物學的建模或仿真,例如:概率模型或動態模型,遺傳基因管理網絡,蛋白質交互作用網絡或新陳代謝作用網絡
G06F19-14 ..用于發展或進化的,例如:進化的保存區域決定或進化樹結構
G06F19-16 ..用于分子結構的,例如:結構排序,結構或功能關系,蛋白質折疊,結構域拓撲,用結構數據的藥靶,涉及二維或三維結構的
G06F19-18 ..用于功能性基因組學或蛋白質組學的,例如:基因型–表型關聯,不均衡連接,種群遺傳學,結合位置鑒定,變異發生,基因型或染色體組的注釋,蛋白質相互作用或蛋白質核酸的相互作用





