[發明專利]一種基于分子地圖的生物樣本快速智能識別方法有效
| 申請號: | 201711248727.1 | 申請日: | 2017-12-01 |
| 公開(公告)號: | CN109870533B | 公開(公告)日: | 2020-12-29 |
| 發明(設計)人: | 張曉哲;趙凡;趙楠 | 申請(專利權)人: | 中國科學院大連化學物理研究所 |
| 主分類號: | G01N30/86 | 分類號: | G01N30/86;G06K9/62;G06N3/08 |
| 代理公司: | 沈陽科苑專利商標代理有限公司 21002 | 代理人: | 馬馳 |
| 地址: | 116023 *** | 國省代碼: | 遼寧;21 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 分子 地圖 生物 樣本 快速 智能 識別 方法 | ||
1.一種基于分子地圖的生物樣本快速智能識別方法,其特征在于:根據生物樣本分子地圖所蘊含的特征,而這些特征在不同類生物樣本中呈現不同的分布模式,對待測樣本進行識別與分類;
包括如下步驟:
A、生物樣本提取物利用X-質譜儀器進行分析,得到X-MS數據,其中,X代表氣相色譜、液相色譜、離子色譜、凝膠色譜、毛細管電泳、離子遷移譜或其他任意一種能夠在時間維度上對分子進行分離的方法,MS代表質譜;該數據中每個離子或化合物,含有保留時間t、質荷比m/z或質量m、強度I三個維度的信息;X-MS數據中總離子的數量≥10;
B、以X-MS數據中的t或其函數變換值,m/z或m或其函數變換值構建分子地圖,圖中的每個點對應X-MS數據中的一個離子或分子,在分子地圖中包括離子的位置,以及離子所形成的強度、輪廓、邊緣或紋理中的一種或兩種以上;其中離子所形成的強度用高度、顏色、亮度和大小中的一種或兩種以上方式表示;
分子地圖構建方式是分別以t或其函數變換值作為橫坐標即第一維度,和以m/z或其函數變換值作為縱坐標即第二維度,每個點強度用高度、顏色、亮度和大小中的一種或兩種以上方式表示;
分子地圖的構建方式或者是將每個離子按照t或其函數變換值的順序或者m/z或m或其函數變換值的順序,于平面圖中的線條上依次有序放置,對應離子形成一個像素點;
C、分子地圖的存儲與分析格式為能夠代表高維數據的格式,具體包括mzXML,xls,t,mat,bmp或jpg中的一種或二種以上;
D、采用相同或相近的操作參數和條件,按上述A-C步驟操作,針對兩個以上的已知生物樣本進行分析,獲取X-MS原始數據;利用圖像生成軟件將X-MS原始數據轉化為分子地圖,得到類別已知訓練樣本的分子地圖集;
E、采用與已知樣本相同或相近的操作參數和條件,按上述A-C步驟操作,針對待分析的待測樣本進行分析,獲取X-MS數據;利用圖像生成軟件將X-MS數據轉化為分子地圖,得到待測樣本的分子地圖;
F、在步驟D-E中,分子地圖分辨率用像素表示,圖形的規格為n*m其中,n≥1,m≥1;分子地圖利用圖像處理工具進行再處理,在分子地圖中,根據離子分布的密集程度與空間關系,形成輪廓、邊緣、斑塊中的一種或兩種以上新的圖形特征;
G、上述的每個分子地圖被分成一個或兩個以上區域,將每一個區域圖像的特征,包括像素的位置,以及參考特征,作為深度學習所用的深度神經網絡的輸入層的輸入;
利用類別已知訓練樣本的分子地圖集,訓練深度神經網絡,提取各類訓練樣本分子地圖的特征,用以表征不同類別訓練樣本的分子地圖集中離子分布的不同模式;
深度神經網絡自帶分類器;
或將深度神經網絡獲得的各類樣本的特征導入到機器學習工具根據分類效果,進行樣本的分類訓練,得到訓練好的深度神經網絡;
H、將步驟E-F中得到的待測樣本的分子地圖導入到訓練好的神經網絡中,對待測樣本分子地圖進行識別,計算待測樣本分子地圖為訓練樣本分子地圖集中各類樣本的所屬類別的概率大小P;
I、分類工具樣本進行分類時,待測樣本不借助閾值或借助閾值進行判定;
1)當不借助閾值時,對概率的大小進行排序,若待測樣本與某類參照樣本的概率排名越靠前,表明待測樣本為與該類樣本的可能性越大,反之越小;
2)當借助閾值時,設定閾值γ,用于判斷不同來源待測樣本與同類參照樣本匹配的可信空間,利用閾值γ將不相關的樣本排除之外;
由深度學習導出各類訓練樣本的概率分布范圍,選定概率的下限作為該類樣本的閾值γ;或,閾值利用文獻報道、實驗觀察或統計學方法得到某類樣本概率分布范圍,選定概率的下限作為該類樣本的閾值γ;其中,樣本數至少為2;采用與步驟A-H相同或相近的操作參數和條件所得到的分析結果;
對概率的大小進行排序,當Sc>γ時,若待測樣本與某類參照樣本的概率排名越靠前,表明待測樣本為與該類樣本的可能性越大,反之越小。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國科學院大連化學物理研究所,未經中國科學院大連化學物理研究所許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201711248727.1/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:在線式非甲烷總烴分析系統
- 下一篇:黃曲霉毒素生物合成通路靶向代謝組分析方法





