[發(fā)明專利]一種流式細(xì)胞儀數(shù)據(jù)自動(dòng)分析方法有效
| 申請(qǐng)?zhí)枺?/td> | 201410129562.6 | 申請(qǐng)日: | 2014-03-31 |
| 公開(kāi)(公告)號(hào): | CN103942415B | 公開(kāi)(公告)日: | 2017-10-31 |
| 發(fā)明(設(shè)計(jì))人: | 王先文;程智;陳鋒;杜耀華;暴洪濤;李辰宇;吳太虎 | 申請(qǐng)(專利權(quán))人: | 中國(guó)人民解放軍軍事醫(yī)學(xué)科學(xué)院衛(wèi)生裝備研究所 |
| 主分類號(hào): | G06F19/00 | 分類號(hào): | G06F19/00;G01N35/00;G01N15/10 |
| 代理公司: | 天津市北洋有限責(zé)任專利代理事務(wù)所12201 | 代理人: | 張金亭 |
| 地址: | 300161 *** | 國(guó)省代碼: | 天津;12 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 細(xì)胞 數(shù)據(jù) 自動(dòng) 分析 方法 | ||
技術(shù)領(lǐng)域
本發(fā)明涉及流式細(xì)胞儀數(shù)據(jù)自動(dòng)分析技術(shù),尤其是涉及流式細(xì)胞儀數(shù)據(jù)的自動(dòng)聚類算法。
技術(shù)背景
流式細(xì)胞術(shù)是一種能夠精確、快速地對(duì)生物細(xì)胞的理化特性和生物學(xué)特性進(jìn)行多參數(shù)定量分析及對(duì)特定細(xì)胞群分選的技術(shù)。近年來(lái),流式細(xì)胞術(shù)發(fā)展迅速,其在許多領(lǐng)域得到廣泛應(yīng)用。流式細(xì)胞術(shù)已向著多激光、高通量方向發(fā)展,擁有在較短時(shí)間內(nèi)對(duì)大量樣本進(jìn)行快速檢測(cè)的能力。然而,由于缺乏成熟并行的數(shù)據(jù)自動(dòng)分析平臺(tái),流式細(xì)胞術(shù)還遠(yuǎn)沒(méi)有發(fā)揮其巨大潛能,實(shí)現(xiàn)樣本的自動(dòng)分析。
流式細(xì)胞儀數(shù)據(jù)分析的主要過(guò)程是樣本的類群識(shí)別,即在樣本中找到屬于同一種類的細(xì)胞群。通常,類群的識(shí)別是通過(guò)將獲得的數(shù)據(jù)經(jīng)過(guò)處理后顯示到2維圖中,然后采用人工畫(huà)門(mén)的方式找到屬于同類的細(xì)胞群,畫(huà)門(mén)的主要方法是將人工視為同類的細(xì)胞通過(guò)劃定一定區(qū)域范圍而歸為一類。由于人工畫(huà)門(mén)方式存在一定的主觀性,分析的結(jié)果通常無(wú)法重現(xiàn)。并且,人工畫(huà)門(mén)的方法無(wú)法滿足高通量數(shù)據(jù)分析的需求,也會(huì)帶來(lái)人力資源的巨大浪費(fèi)。
常見(jiàn)的流式細(xì)胞儀數(shù)據(jù)聚類算法,比如k-means算法,雖然計(jì)算速度比較快,但分析的結(jié)果通常精確度比較低。目前比較先進(jìn)的基于k-means的變化點(diǎn)探測(cè)算法能夠提高數(shù)據(jù)聚類結(jié)果的精確度,但是當(dāng)數(shù)據(jù)中存在高度離群值時(shí),其聚類結(jié)果通常會(huì)出現(xiàn)模型過(guò)擬合現(xiàn)象。另一種數(shù)據(jù)聚類方法為譜聚類方法,該方法雖然在精度上有所提高,但是由于該方法是基于矩陣乘積的方式進(jìn)行結(jié)果估計(jì),因此在樣本量較大時(shí),其計(jì)算時(shí)間非常長(zhǎng)。針對(duì)該問(wèn)題,目前提出的一種預(yù)抽樣譜聚類算法,該方法解決了樣本量大造成的計(jì)算時(shí)間長(zhǎng)的問(wèn)題,但由于對(duì)數(shù)據(jù)進(jìn)行了預(yù)先處理,數(shù)據(jù)中包含的一部分生物信息可能在處理過(guò)程中丟失。另外,當(dāng)分析的數(shù)據(jù)中包含高度離群的值時(shí),該方法的聚類結(jié)果通常誤判率也較高。
發(fā)明內(nèi)容
本發(fā)明為解決公知技術(shù)中存在的技術(shù)問(wèn)題而提供一種流式細(xì)胞儀數(shù)據(jù)自動(dòng)分析方法,該方法能夠?qū)崿F(xiàn)對(duì)流式細(xì)胞儀數(shù)據(jù)的自動(dòng)分析,提高數(shù)據(jù)分析的可重復(fù)性和準(zhǔn)確性,降低人為主觀因素對(duì)分析結(jié)果的影響。
本發(fā)明為解決公知技術(shù)中存在的技術(shù)問(wèn)題所采取的技術(shù)方案是:一種流式細(xì)胞儀數(shù)據(jù)自動(dòng)分析方法,包括以下步驟:
一)采用BIC方法對(duì)數(shù)據(jù)進(jìn)行自動(dòng)類群識(shí)別,得到數(shù)據(jù)中包含的類群數(shù)目;
二)獲得類群數(shù)目后,采用偏斜t混合模型對(duì)數(shù)據(jù)進(jìn)行自動(dòng)聚類。
所述步驟一)中所采用的自動(dòng)類群識(shí)別過(guò)程為:
BIC=-2logL+klogn
其中:
L是偏斜t混合模型極大似然估計(jì)的對(duì)數(shù)似然值;
k是混合模型的獨(dú)立參數(shù);
n是數(shù)據(jù)中被測(cè)樣本的粒子總數(shù)。
所述步驟二)采用的偏斜t混合模型為:
其中:
x為流式細(xì)胞儀數(shù)據(jù);
g為類群數(shù)目;
πi為混合比,表示第個(gè)分量密度在混合密度中的加權(quán)因子;
δ為偏斜參數(shù)向量;
tp,v(x)為位置參數(shù)為μ,尺度矩陣為Σ,自由度為v的p維t分布的概率密度函數(shù);
T1,v+p(x)為位置參數(shù)為μ,尺度矩陣為Σ,自由度為v+p的一維t分布的累積分布函數(shù)。
所述偏斜t混合模型首先采用多維流式細(xì)胞儀數(shù)據(jù)x中的兩個(gè)維度作為偏斜t混合模型的輸入進(jìn)行聚類分析,再將該兩維聚類分析結(jié)果投影到該數(shù)據(jù)x中的剩余其它二個(gè)維度中去,繼續(xù)采用兩維聚類分析方法進(jìn)行分析,直到得到該數(shù)據(jù)x的聚類結(jié)果。
所述偏斜t混合模型以流式細(xì)胞儀數(shù)據(jù)x作為偏斜t混合模型的輸入,采用多維數(shù)據(jù)直接聚類的方法對(duì)數(shù)據(jù)進(jìn)行聚類分析。
所述偏斜t混合模型中參數(shù)的估算方法:
引入向量zj=(z1j,...zgj)T,變量u1,...,un和w1,...,wn,其滿足
其中,HN(0,σ2)為均值為0,方差為σ2的一元半正態(tài)分布,gamma(α,β)為形狀參數(shù)為α,尺度參數(shù)為β的伽馬分布;得到包含變量zij、uj、wj的對(duì)數(shù)似然函數(shù)為:
其中,
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于中國(guó)人民解放軍軍事醫(yī)學(xué)科學(xué)院衛(wèi)生裝備研究所,未經(jīng)中國(guó)人民解放軍軍事醫(yī)學(xué)科學(xué)院衛(wèi)生裝備研究所許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201410129562.6/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06F 電數(shù)字?jǐn)?shù)據(jù)處理
G06F19-00 專門(mén)適用于特定應(yīng)用的數(shù)字計(jì)算或數(shù)據(jù)處理的設(shè)備或方法
G06F19-10 .生物信息學(xué),即計(jì)算分子生物學(xué)中的遺傳或蛋白質(zhì)相關(guān)的數(shù)據(jù)處理方法或系統(tǒng)
G06F19-12 ..用于系統(tǒng)生物學(xué)的建模或仿真,例如:概率模型或動(dòng)態(tài)模型,遺傳基因管理網(wǎng)絡(luò),蛋白質(zhì)交互作用網(wǎng)絡(luò)或新陳代謝作用網(wǎng)絡(luò)
G06F19-14 ..用于發(fā)展或進(jìn)化的,例如:進(jìn)化的保存區(qū)域決定或進(jìn)化樹(shù)結(jié)構(gòu)
G06F19-16 ..用于分子結(jié)構(gòu)的,例如:結(jié)構(gòu)排序,結(jié)構(gòu)或功能關(guān)系,蛋白質(zhì)折疊,結(jié)構(gòu)域拓?fù)洌媒Y(jié)構(gòu)數(shù)據(jù)的藥靶,涉及二維或三維結(jié)構(gòu)的
G06F19-18 ..用于功能性基因組學(xué)或蛋白質(zhì)組學(xué)的,例如:基因型–表型關(guān)聯(lián),不均衡連接,種群遺傳學(xué),結(jié)合位置鑒定,變異發(fā)生,基因型或染色體組的注釋,蛋白質(zhì)相互作用或蛋白質(zhì)核酸的相互作用
- 一種高效免疫活性細(xì)胞群制備及用于抗腫瘤的方法
- 獲得和使用內(nèi)胚層和肝細(xì)胞的組合物和方法
- bumetanide在抑制腫瘤細(xì)胞增殖中的應(yīng)用
- 細(xì)胞陣列計(jì)算系統(tǒng)以及其中細(xì)胞之間的通信方法
- 細(xì)胞陣列計(jì)算系統(tǒng)以及其中細(xì)胞間群發(fā)通信方法
- 獲得和使用內(nèi)胚層和肝細(xì)胞的組合物和方法
- 用于自動(dòng)生成遺傳修飾的T細(xì)胞的方法
- 細(xì)胞核圖像輪廓捕獲設(shè)備及其方法
- 細(xì)胞結(jié)構(gòu)體及細(xì)胞結(jié)構(gòu)體的制造方法
- 一種懸浮細(xì)胞培養(yǎng)中去除死細(xì)胞的方法
- 數(shù)據(jù)顯示系統(tǒng)、數(shù)據(jù)中繼設(shè)備、數(shù)據(jù)中繼方法、數(shù)據(jù)系統(tǒng)、接收設(shè)備和數(shù)據(jù)讀取方法
- 數(shù)據(jù)記錄方法、數(shù)據(jù)記錄裝置、數(shù)據(jù)記錄媒體、數(shù)據(jù)重播方法和數(shù)據(jù)重播裝置
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)發(fā)送系統(tǒng)、數(shù)據(jù)發(fā)送裝置以及數(shù)據(jù)結(jié)構(gòu)
- 數(shù)據(jù)顯示系統(tǒng)、數(shù)據(jù)中繼設(shè)備、數(shù)據(jù)中繼方法及數(shù)據(jù)系統(tǒng)
- 數(shù)據(jù)嵌入裝置、數(shù)據(jù)嵌入方法、數(shù)據(jù)提取裝置及數(shù)據(jù)提取方法
- 數(shù)據(jù)管理裝置、數(shù)據(jù)編輯裝置、數(shù)據(jù)閱覽裝置、數(shù)據(jù)管理方法、數(shù)據(jù)編輯方法以及數(shù)據(jù)閱覽方法
- 數(shù)據(jù)發(fā)送和數(shù)據(jù)接收設(shè)備、數(shù)據(jù)發(fā)送和數(shù)據(jù)接收方法
- 數(shù)據(jù)發(fā)送裝置、數(shù)據(jù)接收裝置、數(shù)據(jù)收發(fā)系統(tǒng)、數(shù)據(jù)發(fā)送方法、數(shù)據(jù)接收方法和數(shù)據(jù)收發(fā)方法
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)再現(xiàn)方法、數(shù)據(jù)發(fā)送裝置及數(shù)據(jù)再現(xiàn)裝置
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)再現(xiàn)方法、數(shù)據(jù)發(fā)送裝置及數(shù)據(jù)再現(xiàn)裝置





