[發明專利]一種多參數流式數據自動分群方法在審
| 申請號: | 201910204433.1 | 申請日: | 2019-03-18 |
| 公開(公告)號: | CN110197193A | 公開(公告)日: | 2019-09-03 |
| 發明(設計)人: | 孟曉辰;祝連慶;婁小平;董明利;于明鑫;劉鋒;宋言明 | 申請(專利權)人: | 北京信息科技大學 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62;G16H50/00 |
| 代理公司: | 北京市科名專利代理事務所(特殊普通合伙) 11468 | 代理人: | 陳朝陽 |
| 地址: | 100085 北*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 多參數 矩陣 流式數據 成分參數 困惑度 低維 分群 降維 迭代結束 迭代尋優 計算條件 矩陣數據 聚類質心 數據分群 隨機選取 損失函數 循環迭代 樣本矩陣 初始化 固定的 概率 聚類 算法 維數 質心 更新 聯合 | ||
一種多參數流式數據自動分群方法,包括如下步驟:步驟一:基于t?SNE的多參數數據分群:輸入待降維多參數流式數據,設定需要降到的維數d以及損失函數參數困惑度;對樣本矩陣X進行初始化,計算相應矩陣之間的距離,使用固定的困惑度計算條件概率pj|i;進入循環迭代:計算低維度下的聯合概率,計算梯度;迭代尋優,更新低維數據,迭代結束后得到的矩陣即為降維后的主成分參數矩陣;步驟二:將主成分參數矩陣數據使用K?means算法聚類:隨機選取個聚類質心點作為初始質心。
技術領域
本發明涉及一種流式細胞儀檢測人體外周血細胞并對血細胞多參數數據進行快速自動分群的方法,屬于生物醫學檢測領域。
技術背景
流式細胞術(flow cytometry)是一種能夠對懸浮的細胞或者其他微粒進行多參數、快速分析或分選的技術。隨著醫學領域的發展,疾病的診斷越來越深入,流式細胞儀能夠檢測的參數也成倍增加,對多參數流式細胞數據進行快速、準確的分析是提高臨床診斷效率的關鍵。流式細胞儀包括光學系統、流動室及液流驅動系統、光電檢測系統和信號處理系統四大部分,其中,信號處理系統的一部分工作是要對大量多色多參數流式數據進行分析,分析難度大,傳統對多色流式數據分析的方法是根據細胞的散射光或熒光的特性,使用專用軟件采用人工設門的方法,分析的過程是根據經驗選取兩組熒光信號特征參數作為橫縱坐標,繪制二維散點圖,在圖中劃定目標細胞類型的區域范圍進行分析,但隨著細胞參數的增多,傳統人工設門的方法已無法人們臨床檢測的需要,其主要存在以下問題:
(1)人工設門缺乏客觀性。專家憑借自身經驗從多種熒光特征中選取兩個繪制散點圖,且圈門和做出細胞類群的判斷也因人而異,沒有量化標準。
(2)分析結果可重復性差。針對不同的數據,人工設門方法并沒有標準統一的畫法。
(3)需要操作者有專業背景。流式數據分析軟件是流式細胞儀專用軟件,涉及到的醫學知識是一般使用者不具備的,存在局限性。
(4)對多維數據間的特征差異無法進行準確識別。數據分析只能顯示二維特征,并尋找差異,而多色多參數高維流式數據的特征只能在多維空間才能顯示出來。
(5)過程繁瑣、效率低、資源浪費巨大。人工分析過程不僅消耗人力,浪費時間,而且分析結果往往可靠性差。
針對人工設門存在的缺點,一些專家學者對流式細胞數據的自動分析方法進行了探索,但是大多是研究對細胞自動聚類的方法,很少有考慮到細胞類群的分布狀態。例如,最早用于流式細胞自動分群的方法K-means算法,通過計算樣本點間的歐氏距離劃分樣本數據,實現聚類;Sugar和Sealfon提出了基于滲透理論的非監督密度輪廓聚類算法(unsupervised density contour clustering algorithm),通過構建樣本數據直方圖尋找數據峰,實現了流式數據中多種形狀細胞類群的快速聚類分析;Qian等人提出了基于網格劃分和合并(grid-based partitioning and merging)類群識別算法,該算法依據數據密度特征識別二維數據中不規則分布的類群細胞;Aghae等提出基于層次聚類思想;還有高斯混合模型等。
發明內容
本發明針對呈非對稱且有拖尾分布的細胞類群,提出了一種基于流行學習的t分布鄰域嵌入算法(t-SNE)的多參數流式數據進行自動分群方法。
本專利的目的是通過下述技術方案實現的。
一種多參數流式數據自動分群方法,其特征在于,包括如下步驟:
步驟一:基于t-SNE的多參數數據分群:
輸入待降維多參數流式數據,設定需要降到的維數d以及損失函數參數困惑度;
對樣本矩陣X進行初始化,計算相應矩陣之間的距離,使用固定的困惑度計算條件概率pj|i;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京信息科技大學,未經北京信息科技大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910204433.1/2.html,轉載請聲明來源鉆瓜專利網。





