[發明專利]基于基因拷貝數改變的模式的非小細胞肺癌的基因組分類有效
| 申請號: | 200980143555.9 | 申請日: | 2009-10-28 |
| 公開(公告)號: | CN102696034A | 公開(公告)日: | 2012-09-26 |
| 發明(設計)人: | D·塞米扎洛夫;盧欣;K·張;R·R·列斯尼夫斯基 | 申請(專利權)人: | 雅培制藥有限公司 |
| 主分類號: | G06F19/24 | 分類號: | G06F19/24;C12Q1/68 |
| 代理公司: | 中國專利代理(香港)有限公司 72001 | 代理人: | 權陸軍;郭文潔 |
| 地址: | 美國伊*** | 國省代碼: | 美國;US |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 基因 拷貝 改變 模式 細胞 肺癌 基因組 分類 | ||
1.用于獲得非小細胞肺癌基因組亞組的數據庫的方法,所述方法包括步驟:
(a)獲得多個,m個,包含至少一個NSCLC細胞的樣品,其中所述樣品包含細胞系或腫瘤;
(b)獲得包括步驟(a)中獲得的每一個樣品的每一條染色體的至少一個基因座的拷貝數改變信息的數據集;
(c)鑒定數據集中被正常細胞污染的樣品并且從數據集消除所述被污染的樣品,其中鑒定和消除包括:
(1)對數據應用與代表腫瘤和正常樣品之間的差異的參數一致的機器學習算法;
(2)賦予每一個樣品如通過機器學習算法測定的正常細胞污染的概率分數;
(3)從數據集中消除每一個得分50%或更大的含正常細胞的概率的樣品的數據;
(d)通過對數據集應用利用Pearson線性相異性算法的無監督聚類算法估計數據集中亞組的數目r;
(e)利用改進的基因組非負矩陣因子分解(gNMF)算法將數據集中的每一個樣品分配至至少一個簇,其中所述改進的gNMF算法包括:
(1)利用公式(11)計算每100步乘性更新后算法的散度:
其中Vij是矩陣V的第i行和第j列,(WH)ij是矩陣(W*H)的第i行和第j列,i從1運行至n,且n是數據集中區段的數目,并且j從1運行至m,且m是數據集中樣品的數目;
(2)如果步驟(e)(1)中計算的散度當與對于之前100步所述算法的乘性更新所計算的散度相比較時減小不超過約0.001%,那么終止算法;
(3)隨機重復算法,進行選擇的運行數,并且使用公式(12)計算每一次運行算法的H的Pearson相關系數矩陣:
其中C是相關矩陣,Ci,j是矩陣C中的第i行和第j列,H,i和H,j是矩陣H中的第i和第j列向量,ρ(H,i,H,j)是H,i與H,j之間的Pearson相關系數,i和j從1運行至m,且m是數據集中的樣品數目,k從1運行至r,且r是來自步驟(d)的亞組的數目;
(4)計算獲自步驟(e)(3)的每一次運行算法的Pearson相關系數矩陣的平均值以獲得平均相關矩陣;
(5)通過使用1減步驟(e)(4)中確定的平均相關矩陣應用無監督聚類算法并且將樹形圖分割至r個簇,將樣品分配至r個亞組中;
(f)應用同表象相關、貝葉斯信息準則或其組合以提供來自數據集的簇的終數目,其中每一個最終的簇限定了每一個腫瘤或細胞系樣品的基因組亞組;和
(g)任選地使用10倍穩定性檢驗評價步驟(f)中選擇的簇的終數目的穩定性。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于雅培制藥有限公司,未經雅培制藥有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/200980143555.9/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:成膜方法及成膜裝置
- 下一篇:X射線CT裝置以及圖像生成方法
- 同類專利
- 專利分類
G06F 電數字數據處理
G06F19-00 專門適用于特定應用的數字計算或數據處理的設備或方法
G06F19-10 .生物信息學,即計算分子生物學中的遺傳或蛋白質相關的數據處理方法或系統
G06F19-12 ..用于系統生物學的建模或仿真,例如:概率模型或動態模型,遺傳基因管理網絡,蛋白質交互作用網絡或新陳代謝作用網絡
G06F19-14 ..用于發展或進化的,例如:進化的保存區域決定或進化樹結構
G06F19-16 ..用于分子結構的,例如:結構排序,結構或功能關系,蛋白質折疊,結構域拓撲,用結構數據的藥靶,涉及二維或三維結構的
G06F19-18 ..用于功能性基因組學或蛋白質組學的,例如:基因型–表型關聯,不均衡連接,種群遺傳學,結合位置鑒定,變異發生,基因型或染色體組的注釋,蛋白質相互作用或蛋白質核酸的相互作用





