[發(fā)明專利]一種基于最小二乘法的肽質(zhì)譜峰特征參數(shù)提取方法無效
| 申請(qǐng)?zhí)枺?/td> | 201410498617.0 | 申請(qǐng)日: | 2014-09-25 |
| 公開(公告)號(hào): | CN104297328A | 公開(公告)日: | 2015-01-21 |
| 發(fā)明(設(shè)計(jì))人: | 易志強(qiáng);李蕓;章劍秋;姚英彪;曾嶸;張福洪;李希元 | 申請(qǐng)(專利權(quán))人: | 杭州電子科技大學(xué) |
| 主分類號(hào): | G01N27/62 | 分類號(hào): | G01N27/62 |
| 代理公司: | 杭州求是專利事務(wù)所有限公司 33200 | 代理人: | 杜軍 |
| 地址: | 310018 浙*** | 國省代碼: | 浙江;33 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 最小二乘法 肽質(zhì)譜峰 特征 參數(shù) 提取 方法 | ||
技術(shù)領(lǐng)域
本發(fā)明屬于生物質(zhì)譜數(shù)據(jù)預(yù)處理及信息提取技術(shù)領(lǐng)域,具體涉及一種基于最小二乘法的肽質(zhì)譜峰特征參數(shù)提取方法。
背景技術(shù)
目前蛋白質(zhì)組研究領(lǐng)域中,基于串聯(lián)質(zhì)譜的肽鑒定是一種廣泛使用的技術(shù)。待鑒定的肽在串聯(lián)質(zhì)譜儀中被誘導(dǎo)碰撞碎裂為碎片離子,碎片離子的質(zhì)荷比與豐度值被質(zhì)譜儀器檢測出來,從而生成串聯(lián)質(zhì)譜數(shù)據(jù),隨后與理論串聯(lián)質(zhì)譜庫進(jìn)行比對(duì)及分析,最終完成對(duì)肽段的鑒定。
通常情況下,每個(gè)碎片離子及其同位素離子在質(zhì)譜圖中并非表現(xiàn)為單一數(shù)值點(diǎn),而是存在若干樣點(diǎn)形成相應(yīng)的譜峰,其輪廓擬合后近似為高斯曲線,即高斯峰。為確定該離子的荷質(zhì)比,需對(duì)這些樣點(diǎn)進(jìn)行預(yù)處理,計(jì)算出其橫軸方向上的質(zhì)心(Centroid),即該離子的實(shí)測質(zhì)荷比。根據(jù)所求質(zhì)心,可進(jìn)而推算出該離子最大豐度值等其他特征參數(shù)。
目前質(zhì)心求解方法有多種,比較常見的思路是:假定質(zhì)譜圖上構(gòu)成高斯峰的各個(gè)樣點(diǎn)均嚴(yán)格分布在某條高斯曲線上,利用各樣點(diǎn)的數(shù)值(質(zhì)荷比和豐度值),代入到參數(shù)未知的通用高斯曲線函數(shù)表達(dá)式中,構(gòu)造聯(lián)立方程組,從而解出相應(yīng)高斯峰的特征參數(shù),包括質(zhì)心,最大豐度值等。當(dāng)前應(yīng)用極為廣泛的一款蛋白質(zhì)組學(xué)數(shù)據(jù)分析軟件MAXQUANT采用的即是這一方法。然而在實(shí)際檢測中,受實(shí)驗(yàn)條件、所在環(huán)境以及儀器設(shè)備噪聲等因素的影響,質(zhì)譜圖上各個(gè)樣點(diǎn)往往并非嚴(yán)格分布在高斯曲線上,而是存在一定偏差。當(dāng)各個(gè)樣點(diǎn)偏差數(shù)值較大,則上述方法中的假設(shè)條件難以成立,因而勢(shì)必造成求解出的特征參數(shù)在數(shù)值上存在較大誤差,進(jìn)而影響到肽段鑒定的精度。采用非線性迭代擬合方式的特征參數(shù)提取方法可以有效克服樣點(diǎn)偏差對(duì)參數(shù)估值精準(zhǔn)度的影響,但此類方法往往比較復(fù)雜,運(yùn)算時(shí)間長,工作效率低,同時(shí)還存在對(duì)初始值敏感現(xiàn)象,以及迭代無法收斂的風(fēng)險(xiǎn)。發(fā)明內(nèi)容
本發(fā)明的目的在于解決上述方法的缺點(diǎn)和不足,提出一種基于最小二乘法的肽質(zhì)譜峰特征參數(shù)提取方法。
設(shè)質(zhì)譜圖中某離子的質(zhì)譜峰由N個(gè)樣點(diǎn)組成,通常情況下N≥3。其坐標(biāo)構(gòu)成集合A。
A={(m1,d1),(m2,d2),…(mN,dN)}
其中,mi表示質(zhì)荷比,di表示豐度,其值大于0,i∈{1,2,3,…,N}。需要通過樣點(diǎn)擬合出的高斯曲線其函數(shù)形式設(shè)為:
其中,高斯曲線函數(shù)f(x)代表豐度值,自變量x代表質(zhì)荷比,a、b和c為待求解的高斯曲線特征參數(shù),分別表征縮放因子、質(zhì)心和標(biāo)準(zhǔn)差。所述的特征參數(shù)提取方法處理步驟如下:
步驟(1)對(duì)各個(gè)樣點(diǎn)的豐度值進(jìn)行排序,選取出數(shù)值最大的3個(gè)樣點(diǎn),假設(shè)其質(zhì)譜圖坐標(biāo)分別為(mj,dj)、(mk,dk)和(mn,dn),j,k,n∈{1,2,…,N}。
步驟(2)對(duì)選取的3個(gè)樣點(diǎn)的豐度值數(shù)據(jù)進(jìn)行預(yù)處理,并構(gòu)造豐度向量Y。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于杭州電子科技大學(xué),未經(jīng)杭州電子科技大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201410498617.0/2.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 一種基于主導(dǎo)因素結(jié)合偏最小二乘法的煤質(zhì)特性分析方法
- 一種基于最小二乘法擬合曲線補(bǔ)償光電編碼器基準(zhǔn)電壓的方法
- 一種基于改進(jìn)最小二乘法的變電站站用負(fù)荷電量預(yù)測方法
- 一種使用移動(dòng)最小二乘法的拉普拉斯摳圖矩陣方法
- 一種基于移動(dòng)最小二乘法的彈道曲線擬合方法
- 一種基于最小二乘法的變壓器鐵心剩磁檢測方法
- 一種基于移動(dòng)最小二乘法的貪婪投影三角化算法單木重建方法
- 一種基于偏最小二乘法的半監(jiān)督降維方法及系統(tǒng)
- 基于偏最小二乘法的疏浚能耗預(yù)測方法
- 一種光伏逆變器系統(tǒng)模型的參數(shù)辨識(shí)方法
- 譜庫的生成方法和串聯(lián)質(zhì)譜譜圖鑒定方法
- 一種利用高能碰撞誘導(dǎo)電離碎裂技術(shù)鑒定蛋白的方法
- 一種基于HCD與ETD質(zhì)譜圖的肽段從頭測序方法及系統(tǒng)
- 基于候選肽段區(qū)分度標(biāo)記圖譜的蛋白質(zhì)二級(jí)質(zhì)譜鑒定方法
- 基于峰強(qiáng)度識(shí)別能力的蛋白質(zhì)二級(jí)質(zhì)譜鑒定方法
- 一種測定白酒中環(huán)二肽的方法
- 一種基于最小二乘法的肽質(zhì)譜峰特征參數(shù)提取方法
- 一種基于非線性擬合方式的肽質(zhì)譜峰特征參數(shù)提取方法
- 一種基于二級(jí)質(zhì)譜的全離子監(jiān)測定量方法
- 蛋白質(zhì)序列數(shù)據(jù)庫并行搜索鑒定方法與裝置





