[發(fā)明專利]基于單細(xì)胞Hi-C數(shù)據(jù)的細(xì)胞類型預(yù)測系統(tǒng)有效
| 申請?zhí)枺?/td> | 202110362899.1 | 申請日: | 2021-04-02 |
| 公開(公告)號: | CN113160886B | 公開(公告)日: | 2023-04-07 |
| 發(fā)明(設(shè)計(jì))人: | 吳昊;周冰;董記華 | 申請(專利權(quán))人: | 山東大學(xué) |
| 主分類號: | G16B20/30 | 分類號: | G16B20/30;G16B40/00;G06N3/0464;G06N3/048;G06F18/214;G06F18/23213;G06F18/24 |
| 代理公司: | 濟(jì)南圣達(dá)知識產(chǎn)權(quán)代理有限公司 37221 | 代理人: | 李圣梅 |
| 地址: | 250101 山東*** | 國省代碼: | 山東;37 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 基于 單細(xì)胞 hi 數(shù)據(jù) 細(xì)胞 類型 預(yù)測 系統(tǒng) | ||
本公開提出了基于單細(xì)胞H?i?C數(shù)據(jù)的細(xì)胞類型預(yù)測系統(tǒng),包括:數(shù)據(jù)預(yù)處理模塊,被配置為:對于單細(xì)胞H?i?C數(shù)據(jù),將一條染色體按照預(yù)先設(shè)置的分辨率分成若干個(gè)不重疊的b?i?ns,然后對信息進(jìn)行匹配,構(gòu)成接觸矩陣;神經(jīng)網(wǎng)絡(luò)模塊,被配置為:對數(shù)據(jù)預(yù)處理模塊處理后的接觸矩陣進(jìn)行處理,輸出模型預(yù)測結(jié)果的四種細(xì)胞類型。該預(yù)測模型能夠應(yīng)用于對未知類型的細(xì)胞測序數(shù)據(jù)進(jìn)行細(xì)胞類型預(yù)測。
技術(shù)領(lǐng)域
本公開屬于計(jì)算機(jī)數(shù)據(jù)處理技術(shù)領(lǐng)域,尤其涉及基于單細(xì)胞Hi-C數(shù)據(jù)的細(xì)胞類型預(yù)測系統(tǒng)。
背景技術(shù)
本部分的陳述僅僅是提供了與本公開相關(guān)的背景技術(shù)信息,不必然構(gòu)成在先技術(shù)。
最早,各種DNA測序技術(shù)由化學(xué)降解法、雙脫氧鏈終止法等傳統(tǒng)的測序方法發(fā)展而來,但是由于早期儀器技術(shù)的不發(fā)達(dá)而導(dǎo)致傳統(tǒng)的DNA測序技術(shù)存在一些缺陷:誤差過大、方法過于復(fù)雜且無法重復(fù)測定等。隨著人們對大規(guī)模基因組測序的需求提高,這些早期的DNA測序技術(shù)因無法做到對基因組的深度測序和重復(fù)測序而被慢慢淘汰。
為了實(shí)現(xiàn)大規(guī)模基因組的測序,研究人員研發(fā)了一種新的測序方法—Hi-C。Hi-C技術(shù)由已被廣泛應(yīng)用的3C、4C技術(shù)作為基礎(chǔ),依靠高通量測序技術(shù)成功地揭示了細(xì)胞內(nèi)染色體間的互相作用信息,是一種功能強(qiáng)大,低成本且被廣泛應(yīng)用的方法。然而Hi-C技術(shù)存在一定的缺陷:須要輸入的細(xì)胞數(shù)量高達(dá)數(shù)百萬個(gè),并且由于細(xì)胞之間基因組組織的變化,只能提供基因組構(gòu)象的總體平均值。
單細(xì)胞研究方法促進(jìn)了我們對細(xì)胞類型異質(zhì)性的理解,其中從傳統(tǒng)的?RNA-seq測序技術(shù)演變而來的單細(xì)胞RNA-seq技術(shù)已經(jīng)較為全面且被廣泛應(yīng)用了,從而單細(xì)胞技術(shù)在Hi-C測序技術(shù)上得以應(yīng)用。研究人員提出了一個(gè)新的測序方法——單細(xì)胞Hi-C技術(shù),能夠使用單細(xì)胞Hi-C測序得到每個(gè)細(xì)胞詳細(xì)的實(shí)時(shí)表達(dá)譜。先前的Hi-C測序方法是從數(shù)百萬個(gè)細(xì)胞中平均地確定染色體構(gòu)造,單細(xì)胞Hi-C技術(shù)則是將其轉(zhuǎn)變?yōu)閺膯蝹€(gè)細(xì)胞中確定染色體和基因組結(jié)構(gòu),并且具有檢測單個(gè)細(xì)胞中數(shù)千個(gè)同步染色質(zhì)相互作用的能力。一般而言,在用單細(xì)胞Hi-C技術(shù)檢測細(xì)胞的相互作用信息時(shí),產(chǎn)生的相互作用圖譜很稀疏,但是這些互作用數(shù)據(jù)提供了有用的信息,有助于了解核基因組組織和染色體結(jié)構(gòu)中的細(xì)胞變異性。單細(xì)胞染色體構(gòu)造的簡要說明信息可能反映了它們的動態(tài)行為。在對單細(xì)胞染色體結(jié)構(gòu)的說明信息進(jìn)行分析時(shí),這些數(shù)據(jù)提供了一定的可能性,而且單細(xì)胞技術(shù)具有捕獲細(xì)胞異質(zhì)性的能力。稀疏的單細(xì)胞Hi-C數(shù)據(jù)被數(shù)學(xué)計(jì)算方面的方法處理后,被用于分子生物學(xué)方向的研究人員進(jìn)一步地使用和分析,因此有關(guān)單細(xì)胞?Hi-C數(shù)據(jù)的計(jì)算分析方法對促進(jìn)生物學(xué)的研究是有必要的。
細(xì)胞類型預(yù)測是基因組學(xué)中細(xì)胞類型鑒定和藥物開發(fā)的關(guān)鍵,可以解決生物學(xué)實(shí)驗(yàn)中細(xì)胞分類的困難和耗時(shí)問題。
在以往的研究中,醫(yī)療上的各種細(xì)胞分類問題皆是采用圖像處理技術(shù)和模式識別等技術(shù)實(shí)現(xiàn),例如對白細(xì)胞的分類和計(jì)數(shù)。而這些方法技術(shù)都是基于圖像層面的,這些方法都存在一些常見問題,細(xì)胞圖像的分割的精確與否,直接影響到特征提取和分類的準(zhǔn)確性。目前還未有在細(xì)胞染色體結(jié)構(gòu)層面的準(zhǔn)確的細(xì)胞分類方法,單細(xì)胞Hi-C技術(shù)能夠分辨單個(gè)染色體的構(gòu)象模型,并闡明染色體的相互作用以及基因組功能的受控機(jī)制,適用于稀少細(xì)胞以及處于特殊形態(tài)細(xì)胞的染色體功能構(gòu)象解析,現(xiàn)在仍缺乏基于單細(xì)胞Hi-C數(shù)據(jù)的方便準(zhǔn)確的細(xì)胞類型預(yù)測方法。
發(fā)明內(nèi)容
為克服上述現(xiàn)有技術(shù)的不足,本公開提供了基于單細(xì)胞Hi-C數(shù)據(jù)的細(xì)胞類型預(yù)測系統(tǒng),能夠應(yīng)用于對未知類型的細(xì)胞測序數(shù)據(jù)進(jìn)行細(xì)胞類型預(yù)測。
為實(shí)現(xiàn)上述目的,本公開的一個(gè)或多個(gè)實(shí)施例提供了如下技術(shù)方案:
第一方面,公開了基于單細(xì)胞Hi-C數(shù)據(jù)的細(xì)胞類型預(yù)測系統(tǒng),包括:
數(shù)據(jù)處理模塊,被配置為:對于單細(xì)胞Hi-C數(shù)據(jù)集,將細(xì)胞的每一條染色體按照預(yù)先設(shè)置的分辨率分成若干個(gè)不重疊的bins片段,然后根據(jù)數(shù)據(jù)中的序列對信息進(jìn)行匹配,從而每一個(gè)細(xì)胞的每一條染色體構(gòu)成一個(gè)接觸矩陣;
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于山東大學(xué),未經(jīng)山東大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110362899.1/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 單細(xì)胞表現(xiàn)型數(shù)據(jù)庫系統(tǒng)和搜索引擎
- 活體單細(xì)胞拉曼分析平臺數(shù)字控制系統(tǒng)和方法
- 單細(xì)胞捕獲轉(zhuǎn)移系統(tǒng)及單細(xì)胞捕獲轉(zhuǎn)移方法
- 高通量單細(xì)胞轉(zhuǎn)錄組與基因突變整合分析方法
- 基于交變滯慣力打印的單細(xì)胞水平相互作用模型構(gòu)建方法
- 單細(xì)胞蛋白生產(chǎn)菌及其應(yīng)用
- miRNA因果調(diào)控網(wǎng)絡(luò)識別方法、裝置、電子設(shè)備及存儲介質(zhì)
- 一種單細(xì)胞分選裝置和單細(xì)胞分選方法
- 一種單細(xì)胞培養(yǎng)系統(tǒng)及單細(xì)胞培養(yǎng)方法
- 流體捕獲芯片、單細(xì)胞捕獲轉(zhuǎn)移系統(tǒng)與單細(xì)胞分析方法
- 低密度生成矩陣碼的生成矩陣構(gòu)造和編解碼方法及裝置
- 低密度奇偶校驗(yàn)碼的校驗(yàn)矩陣構(gòu)造和編解碼方法及裝置
- 一種噴泉碼的校驗(yàn)矩陣構(gòu)造方法、編解碼方法及裝置
- 基于主成分分析的融合HI等效性鋰離子電池退化預(yù)測方法
- 歌曲的播放方法和移動終端
- 一種4k及IPC輸入高清錄播主機(jī)
- 一種4k超清轉(zhuǎn)碼卡
- Hi-C數(shù)據(jù)分辨率增強(qiáng)方法、系統(tǒng)、電子設(shè)備及存儲介質(zhì)
- 重組金黃色葡萄球菌疫苗HI蛋白原液中GST殘留量檢測方法及GST蛋白標(biāo)準(zhǔn)品和應(yīng)用
- 數(shù)字化模型融合方法及裝置
- 數(shù)據(jù)顯示系統(tǒng)、數(shù)據(jù)中繼設(shè)備、數(shù)據(jù)中繼方法、數(shù)據(jù)系統(tǒng)、接收設(shè)備和數(shù)據(jù)讀取方法
- 數(shù)據(jù)記錄方法、數(shù)據(jù)記錄裝置、數(shù)據(jù)記錄媒體、數(shù)據(jù)重播方法和數(shù)據(jù)重播裝置
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)發(fā)送系統(tǒng)、數(shù)據(jù)發(fā)送裝置以及數(shù)據(jù)結(jié)構(gòu)
- 數(shù)據(jù)顯示系統(tǒng)、數(shù)據(jù)中繼設(shè)備、數(shù)據(jù)中繼方法及數(shù)據(jù)系統(tǒng)
- 數(shù)據(jù)嵌入裝置、數(shù)據(jù)嵌入方法、數(shù)據(jù)提取裝置及數(shù)據(jù)提取方法
- 數(shù)據(jù)管理裝置、數(shù)據(jù)編輯裝置、數(shù)據(jù)閱覽裝置、數(shù)據(jù)管理方法、數(shù)據(jù)編輯方法以及數(shù)據(jù)閱覽方法
- 數(shù)據(jù)發(fā)送和數(shù)據(jù)接收設(shè)備、數(shù)據(jù)發(fā)送和數(shù)據(jù)接收方法
- 數(shù)據(jù)發(fā)送裝置、數(shù)據(jù)接收裝置、數(shù)據(jù)收發(fā)系統(tǒng)、數(shù)據(jù)發(fā)送方法、數(shù)據(jù)接收方法和數(shù)據(jù)收發(fā)方法
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)再現(xiàn)方法、數(shù)據(jù)發(fā)送裝置及數(shù)據(jù)再現(xiàn)裝置
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)再現(xiàn)方法、數(shù)據(jù)發(fā)送裝置及數(shù)據(jù)再現(xiàn)裝置





