[發明專利]一種用于冷凍電鏡分析的單顆粒圖像聚類方法有效
| 申請號: | 201710116076.4 | 申請日: | 2017-03-01 |
| 公開(公告)號: | CN106951918B | 公開(公告)日: | 2020-04-28 |
| 發明(設計)人: | 沈紅斌;殷碩 | 申請(專利權)人: | 上海交通大學 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62;G06K9/00 |
| 代理公司: | 上海伯瑞杰知識產權代理有限公司 31227 | 代理人: | 孟旭彤 |
| 地址: | 200240 *** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 用于 冷凍 分析 顆粒 圖像 方法 | ||
本發明涉及一種用于冷凍電鏡分析的單顆粒圖像聚類方法。一種單顆粒圖像聚類方法,用于單顆粒圖像分析,包括:步驟一:接受用戶輸入初始類數目k0,最終類的數目kn和輸入數據集,隨機初始化數據集為k0個類,計算類中心,對輸入數據集建立共享K最近鄰網絡;步驟二:進行一次KMeans聚類,度量輸入圖像和類中心相似度時,將類中心加入網絡中,并更新網絡,計算節點之間的基于網絡的相似性;步驟三:判斷當前類的數目K是否等于用戶輸入kn,如果是,輸出各個類和類平均圖像,并退出,否則分裂最大的類并返回步驟二繼續執行。
技術領域
本發明屬于結構生物學分析技術領域,特別涉及一種用于冷凍電鏡分析的單顆粒圖像聚類方法。
背景技術
冷凍電鏡技術是一種把樣本置入超冷的環境中再利用電子顯微鏡進行二維圖像采樣進而生成樣本三維模型的技術。與X射線晶體學和核磁共振技術這兩種成熟的結構生物學研究手段相比,冷凍電鏡技術具有可直接獲得分子的形貌信息和相位信息,能夠解析那些不適合應用X射線晶體學和核磁共振技術進行分析的蛋白質等優點。隨著生物樣品制備技術的完善,電子顯微鏡設備的進步以及數字圖像處理技術的發展,電子顯微學已經成為一種公認的研究生物大分子、超分子復合體及亞細胞結構的有力手段。
最常用的冷凍電鏡方法是單顆粒圖像分析,單顆粒圖像分析是將大量的二維投影圖像生成三維模型的技術。但是目前電子顯微鏡得到的圖像信噪比極低,所以為了得到比較精確的三維模型必須收集大量的單顆粒圖像數據,在數千到數萬張圖像的量級。所以,在進行三維重構之前需要對圖像進行聚類,從而確保每一類中的圖像屬于從同一投影方向生成的投影圖。而單顆粒圖像的特點表現為信噪比極低,常常低于1/30,所以傳統的圖像聚類算法在單顆粒圖像上已經不再適用。
目前常用的單顆粒圖像聚類算法大多是基于KMeans算法的變種。SPIDER軟件采用的是首先濾波去噪,然后對像素空間進行PCA降維,最后采用分裂的KMeans方法進行聚類。EMAN2軟件采用的是,對圖像進行特征提取,然后在特征空間進行KMeans聚類。XMIPP軟件采用的是直接在像素空間進行分裂的KMeans聚類,但是聚類準則是XMIPP提出的一種特殊的方法。
不論是在特征空間還是像素空間進行聚類,現在流行的算法的相似性度量都是兩兩相似性度量,即兩幅圖像的相似性的得出只需要這兩幅圖像。但是由于單顆粒圖像的噪聲很大,導致兩兩相似性的度量結果已經不再可靠。由于相似性度量是聚類中最基本的問題,一旦相似性度量不準確,之后的步驟也就失去了意義。
再者,輸入的單顆粒圖像數據本身具有類的結構信息,變現為屬于同一類的圖像之間距離比較近,只是由于噪聲的影響類間距離變小,類內距離變大,這使得用傳統的方法難以區分類。
發明內容
本發明提供一種用于冷凍電鏡分析的單顆粒圖像聚類方法,采用網絡的方法,利用全局的結構信息來抑制噪聲的影響。
一種單顆粒圖像聚類方法,用于單顆粒圖像分析,包括以下步驟:
步驟一:接受用戶輸入初始類數目k0,最終類的數目kn和輸入數據集,隨機初始化數據集為k0個類,計算類中心,對輸入數據集建立共享K最近鄰網絡;
步驟二:進行一次KMeans聚類,度量輸入圖像和類中心相似度時,將類中心加入網絡中,并更新網絡,計算節點之間的基于網絡的相似性(structural similarity);
步驟三:判斷當前類的數目K是否等于用戶輸入kn,如果是,輸出各個類和類平均圖像,并退出,否則分裂最大的類并返回步驟二繼續執行。
步驟二的具體實現包括:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于上海交通大學,未經上海交通大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710116076.4/2.html,轉載請聲明來源鉆瓜專利網。





