[發明專利]應用計算機技術管理、合成、可視化和探索大型多參數數據集的參數在審
| 申請號: | 201780069990.6 | 申請日: | 2017-12-13 |
| 公開(公告)號: | CN109937358A | 公開(公告)日: | 2019-06-25 |
| 發明(設計)人: | 詹姆斯·阿爾瑪羅德;約瑟夫·斯皮德倫;邁克爾·大衛·斯塔德尼斯凱 | 申請(專利權)人: | 佛羅喬有限責任公司 |
| 主分類號: | G01N15/14 | 分類號: | G01N15/14;G01N33/53;G01N33/48;C12N15/10;C12N5/071;C12Q1/68 |
| 代理公司: | 北京安信方達知識產權代理有限公司 11262 | 代理人: | 陸建萍;楊明釗 |
| 地址: | 美國俄*** | 國省代碼: | 美國;US |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 數據集 多參數 應用計算機技術 關聯數據結構 基因表達數據 細胞基因表達 計算機技術 可視化技術 細胞 基因集合 用戶關注 數據處理 基因 可視化 散點圖 細胞群 新關系 迭代 合成 創建 應用 探索 發現 管理 | ||
公開了計算機技術,其將創新的數據處理和可視化技術應用于諸如細胞基因表達數據的大型多參數數據集,以發現諸如細胞和基因之間的關系的新關系,并在代表這些關系的數據集內創建新的關聯數據結構。例如,基因表達數據的散點圖可以在細胞視圖和基因視圖之間迭代地旋轉,以找到用戶關注的細胞群和基因集合。
相關專利申請的交叉引用和優先權要求
本專利申請要求于2016年12月14日提交的序列號為62/433,930并且標題為“Applied Computer Technology for Management,Synthesis,Visualization,andExploration of Parameters in Large Multi-Parameter Data Sets”的美國臨時專利申請的優先權,其全部公開內容通過引用并入本文。
引言
可用于大量人群和各個細胞的大量的遺傳和基因表達信息已經增長到了對于調查人員來說變得難以控制(unwieldy)的程度。例如,細胞基因表達(gene expression)數據可以包括成千上萬個基因(例如,10,000-30,000個或更多個基因)的基因表達數據,現在可以針對各個細胞進行測量,并且每個樣本可以測量成千上萬個細胞。這在細胞基因表達數據的可視化、分析、探索和理解領域提出了一個巨大的技術問題。
例如,對于使用計算機來促進細胞基因表達數據可視化的傳統方法,可視化是最終的終點,并且作為用戶使用R編程語言手動編寫腳本的結果,得出可視化,這要求用戶具有不同庫的知識,以便執行數據輸入、重新格式化、操作、計算和繪圖。這些腳本通常必須針對特定的數據集進行定制,并且它們的創建需要對編程語言、現有庫以及用于產生結果所需的輸入的專門知識。此外,這種常規方法阻礙了對異質細胞群(cell population)的深入探索。
作為該技術問題的解決方案,發明人公開了計算機技術的應用,其使用遍及細胞表達數據的各個維度的創新的散點圖(scatterplot)顯示,包括細胞(或細胞群)視圖散點圖,其中細胞被可視化為各個數據點(例如,細胞的基因相對于基因散點圖的關系),以及基因視圖散點圖,其中,基因被可視化為各個數據點(例如,基因的細胞群相對于細胞群散點圖的關系)。可以在這些散點圖中執行門控(gate),以分別創建細胞群和基因集合,這些細胞群和基因集合可以充當生物學相關的維度,而被添加到工作區中作為新的數據對象,以用于擴充(augment)細胞基因表達數據,并且為有意義的調查開辟新的途徑。作為對比,基于各個基因,以隔離的、孤立的方式進行這種分析很快變得難以控制,而在細胞視圖散點圖和基因視圖散點圖之間旋轉(pivot)的能力允許用戶找到生物學相關的基因分組,然后可以將其作為細胞視圖散點圖的合成(synthetic)參數進行進一步研究。
如上所述,對于本領域的傳統的可視化系統,可視化充當過程中的終點,而不能充當進一步創建用于進一步研究的進一步可視化細化(refinements)的起點。作為示例,來自轉移性黑色素瘤患者的免疫細胞樣本可以包含T細胞,并且本領域的傳統可視化系統將只能識別免疫細胞內的該亞群(subset)。然而,本文描述的創新計算機系統允許對T細胞亞群進行深入的探索和分析,以識別這些T細胞內的多個亞群,例如“耗盡(exhausted)”的T細胞,跟蹤這種狀態到各個基因,然后這些基因可以被靶向以逆轉這種耗盡,激活T細胞,從而可能刺激免疫反應以根除轉移,如下面參考示例實施例更詳細解釋的。
因此,通過本文描述的創新可視化技術,計算機技術可以應用于細胞基因表達數據,以發現細胞和基因之間的新關系,并在代表這些關系的細胞基因表達數據內創建新的關聯數據結構。
通過這些和其他特征,本發明的示例實施例在應用生物信息學領域提供了顯著的技術進步。
附圖簡述
圖1公開了一個示例計算機系統,其可以用于支持本文描述的創新數據處理和可視化技術。
圖2A描繪了細胞基因表達數據集的示例。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于佛羅喬有限責任公司,未經佛羅喬有限責任公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201780069990.6/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:分析溶劑分子在聚合物材料中的擴散系數的方法
- 下一篇:場景上的氣體的檢測





