[發(fā)明專利]一種借助支持向量機(jī)建立過敏原家族特征肽的過敏原的預(yù)測方法有效
| 申請?zhí)枺?/td> | 201110302532.7 | 申請日: | 2011-10-09 |
| 公開(公告)號: | CN102346817A | 公開(公告)日: | 2012-02-08 |
| 發(fā)明(設(shè)計(jì))人: | 陶愛林;張利達(dá);鄒澤紅;黃于藝 | 申請(專利權(quán))人: | 廣州醫(yī)學(xué)院第二附屬醫(yī)院 |
| 主分類號: | G06F19/24 | 分類號: | G06F19/24 |
| 代理公司: | 廣州粵高專利商標(biāo)代理有限公司 44102 | 代理人: | 陳衛(wèi) |
| 地址: | 510260 廣東*** | 國省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 借助 支持 向量 建立 過敏原 家族 特征 預(yù)測 方法 | ||
技術(shù)領(lǐng)域
本發(fā)明屬于生物信息學(xué)技術(shù)領(lǐng)域,更確切的是涉及一種借助支持向量機(jī)建立過敏原家族特征肽的過敏原的預(yù)測方法。
背景技術(shù)
近年來,隨著一些農(nóng)藝性狀得到遺傳改良的食物增多及基因工程藥物的應(yīng)用增加,一些對人類具有潛在過敏的蛋白可能引入這些食品和藥品中,由此將導(dǎo)致過敏性體質(zhì)人群的生活壓力和整個(gè)社會(huì)的生活成本增加。在這些新蛋白基因遺傳轉(zhuǎn)化之前及與人體的產(chǎn)生接觸之前,先期進(jìn)行過敏原性評價(jià),顯得十分迫切。而應(yīng)用軟件對蛋白的過敏原性進(jìn)行精確預(yù)測是過敏原性評價(jià)的最經(jīng)濟(jì)有效的首選方案。過敏原性的精確評估,既可避免高過敏原性蛋白基因的應(yīng)用所帶來的前期巨額投入,又可避免這類蛋白對人體的傷害,使風(fēng)險(xiǎn)成本得到降低。
目前,國內(nèi)尚沒有一款可以評價(jià)過敏原的軟件,而國際上,過敏原性預(yù)測軟件可以概括為如下幾類方法進(jìn)行過敏原檢測,包話:(1)通常的序列比對;(2)基于滑動(dòng)肽窗口原理的過敏原IgE表位和基序的檢測;(3)以支持向量機(jī)(Support?Vector?Machine,?SVM)為支持算法的分類器來區(qū)分過敏原和非過敏原;(4)基于過敏原代表肽段(Allergen?Representative?Peptides,?ARPs)或經(jīng)過長度調(diào)整后的過敏原肽段構(gòu)建的描述器(Detection?based?on?Filtered?Length-adjusted?Allergen?Peptides,?DFLAPs)。當(dāng)待查詢序列或其片段與已知過敏原完全相同、或者同源、或者具有匹配的基序時(shí),這些軟件就非常有效,而對于那些跟已知過敏原相似性低的新型蛋白質(zhì),這些軟件的預(yù)測準(zhǔn)確性就不佳了。因此,為了從隨機(jī)的序列數(shù)據(jù)、特別是從那些農(nóng)藝性狀優(yōu)良而尚未開發(fā)的外源基因里甄別過敏原,以避免將從未被人類作為食物的外源基因通過遺傳工程等方法引入食品中,需要在準(zhǔn)確性、特異性和敏感性等方面對過敏原預(yù)測軟件進(jìn)行大幅度的改良提高。
發(fā)明內(nèi)容
本發(fā)明要解決的技術(shù)問題是克服現(xiàn)有技術(shù)的不足而提供一種能提高過敏原預(yù)測的敏感性、特異性和精確性的基于支持向量機(jī)的過敏原的預(yù)測方法。
為解決上述技術(shù)問題,本發(fā)明的技術(shù)方案是:一種借助支持向量機(jī)建立過敏原家族特征肽的過敏原的預(yù)測方法,包括以下步驟:
步驟1:數(shù)據(jù)庫的建立,
從各過敏原數(shù)據(jù)庫經(jīng)過篩選得到的過敏原序列和非過敏原序列作為數(shù)據(jù)庫;
步驟2:?過敏原家族特征肽的提取,
針對過敏原序列進(jìn)行聚類分析,在形成的每一過敏原家族中,過敏原序列按照每相隔1-10個(gè)堿基用滑動(dòng)窗口分成6-32個(gè)堿基長度的肽段,然后用所得肽段和非過敏原序列進(jìn)行BLAST?(Basic?Local?Alignment?Search?Tool,序列基本對齊本地搜索工具)比對后,剔除那些與非過敏原相同或相似的片段,而那些和非過敏原序列沒配對的肽段,并且E值低于10-7~10-1時(shí),即是過敏原特征肽(Allergen?Featured?Peptides,?AFPs),而落在同一過敏原上且相鄰的過敏原特征肽拼接后形成由2-30個(gè)小的特征肽構(gòu)成的過敏原家族特征肽(Allergen?Family?Featured?Peptides,?AFFPs);
步驟3:?建立支持向量機(jī)模型,
對于一個(gè)查詢蛋白X建立特征向量FX?=?fx1,?fx2,?…,?fxn?,?n代表過敏原家族特征肽庫的片段數(shù)量,fxi為蛋白X和第i個(gè)AFFP進(jìn)行BLAST?(Basic?Local?Alignment?Search?Tool,?序列基本對齊本地搜索工具)后E值均一化的值作為矢量,并轉(zhuǎn)換為徑向基函數(shù)(Radial?Basis?Function,?RBF);
步驟4:支持向量機(jī)模型的性能測定,
采用交叉驗(yàn)證方法進(jìn)行測定,即將訓(xùn)練集隨機(jī)均分成n個(gè)互不相交的子集,利用n-1個(gè)訓(xùn)練子集,對給定的一組參數(shù)建立模型,利用剩下一個(gè)子集做測試評估參數(shù)性能,即為n倍的內(nèi)在交叉效度。
??進(jìn)一步的,上述方案中步驟3所述對BLAST?(Basic?Local?Alignment?Search?Tool,?序列基本對齊本地搜索工具)比對所得的E值x進(jìn)行均一化,均一化的公式如下:
或,其中C為0~20的常數(shù)。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于廣州醫(yī)學(xué)院第二附屬醫(yī)院,未經(jīng)廣州醫(yī)學(xué)院第二附屬醫(yī)院許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201110302532.7/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 上一篇:一種油田回注水殺菌組合物及其制備方法
- 下一篇:一種抗病毒的組合藥物
- 同類專利
- 專利分類
G06F 電數(shù)字?jǐn)?shù)據(jù)處理
G06F19-00 專門適用于特定應(yīng)用的數(shù)字計(jì)算或數(shù)據(jù)處理的設(shè)備或方法
G06F19-10 .生物信息學(xué),即計(jì)算分子生物學(xué)中的遺傳或蛋白質(zhì)相關(guān)的數(shù)據(jù)處理方法或系統(tǒng)
G06F19-12 ..用于系統(tǒng)生物學(xué)的建模或仿真,例如:概率模型或動(dòng)態(tài)模型,遺傳基因管理網(wǎng)絡(luò),蛋白質(zhì)交互作用網(wǎng)絡(luò)或新陳代謝作用網(wǎng)絡(luò)
G06F19-14 ..用于發(fā)展或進(jìn)化的,例如:進(jìn)化的保存區(qū)域決定或進(jìn)化樹結(jié)構(gòu)
G06F19-16 ..用于分子結(jié)構(gòu)的,例如:結(jié)構(gòu)排序,結(jié)構(gòu)或功能關(guān)系,蛋白質(zhì)折疊,結(jié)構(gòu)域拓?fù)洌媒Y(jié)構(gòu)數(shù)據(jù)的藥靶,涉及二維或三維結(jié)構(gòu)的
G06F19-18 ..用于功能性基因組學(xué)或蛋白質(zhì)組學(xué)的,例如:基因型–表型關(guān)聯(lián),不均衡連接,種群遺傳學(xué),結(jié)合位置鑒定,變異發(fā)生,基因型或染色體組的注釋,蛋白質(zhì)相互作用或蛋白質(zhì)核酸的相互作用
- 移動(dòng)向量解碼方法和移動(dòng)向量解碼裝置
- 一種用于支持向量機(jī)的在線向量選取方法
- 用于在幀序列中執(zhí)行運(yùn)動(dòng)估計(jì)的數(shù)據(jù)處理系統(tǒng)和方法
- 神經(jīng)網(wǎng)絡(luò)的處理方法及裝置、存儲(chǔ)介質(zhì)、電子設(shè)備
- 字符序列處理方法及設(shè)備
- 向量獲取方法、裝置、電子設(shè)備以及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)
- 向量獲取方法、裝置、電子設(shè)備以及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)
- 近鄰向量的召回方法、裝置、計(jì)算機(jī)設(shè)備及存儲(chǔ)介質(zhì)
- 一種向量運(yùn)算裝置及運(yùn)算方法
- 生成類別向量的方法和裝置





