[發明專利]一種鱗癌組織功能狀態與細胞組分評估方法及系統有效
| 申請號: | 202110884396.0 | 申請日: | 2021-08-03 |
| 公開(公告)號: | CN113593640B | 公開(公告)日: | 2023-07-28 |
| 發明(設計)人: | 區樂淳;趙二杰;梁繼生 | 申請(專利權)人: | 哈爾濱市米杰生物科技有限公司 |
| 主分類號: | G16B30/00 | 分類號: | G16B30/00;G16B40/30 |
| 代理公司: | 黑龍江立超同創知識產權代理有限責任公司 23217 | 代理人: | 孫春玲 |
| 地址: | 150000 黑龍江省哈爾濱市*** | 國省代碼: | 黑龍江;23 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 組織 功能 狀態 細胞 組分 評估 方法 系統 | ||
1.一種鱗癌組織功能狀態與細胞組分評估方法,其特征在于,包括下述步驟:
步驟一、獲取鱗狀細胞癌組織單細胞測序數據;
步驟二、對所述單細胞測序數據進行無監督聚類分析,識別獲得包含以下細胞類型的單細胞樣本數據:B/Plasma細胞、T/NK細胞、內皮細胞、上皮細胞、成纖維細胞、Langerin樹突細胞、肥大細胞、成熟樹突細胞、黑色素細胞、漿細胞樣樹突細胞和單核細胞;
步驟三、通過對各個細胞類型的單細胞樣本數據進行無監督聚類分析,識別獲得各個細胞類型內的細胞亞群樣本數據;
步驟四、獲取14種單細胞組織功能狀態相關基因集,根據所述基因集對待評估鱗癌組織進行組織功能狀態的評估;具體步驟包括:
從CancerSEA數據庫中提取與組織功能狀態相關的14種單細胞組織功能狀態基因集并以其在CancerSEA數據庫中對應的編號數據集的數目作為權重;
在待評估鱗癌組織的測序數據中提取14種功能狀態基因;
以所述權重對每個功能狀態基因進行加權,并計算各個功能狀態基因的均值,從而獲得組織功能狀態的得分;
所述組織功能狀態包括血管生成、細胞凋亡、細胞周期、細胞分化、DNA損傷、DNA修復、細胞上皮間質化、細胞缺氧、炎癥發生、癌細胞侵襲、癌細胞轉移、癌細胞增殖、細胞靜息、干細胞性;
步驟五、根據所述單細胞樣本數據或各個細胞類型內的細胞亞群樣本數據對待評估鱗癌組織的各個細胞類型或各個細胞亞群類型進行細胞組分的評估;具體步驟包括:
樣本間細胞組分的評估功能:通過基因差異表達分析,篩選獲得單細胞樣本數據或細胞亞群樣本數據中的樣本細胞特征表達基因;根據所述樣本細胞特征表達基因計算待評估鱗癌組織中各個細胞類型或細胞亞群類型的細胞特征表達基因的均值,輸出不同細胞類型或細胞亞群類型的浸潤含量評分;
樣本內細胞組分的評估功能:通過基因差異表達分析,篩選獲得單細胞樣本數據或細胞亞群樣本數據中的細胞特征表達基因,并生成樣本特征表達矩陣;通過非負線性最小二乘回歸方法計算待評估鱗癌組織中各個細胞類型或細胞亞群類型的細胞特征表達矩陣與樣本特征表達矩陣的擬合回歸系數,通過不斷迭代獲得最終擬合回歸系數,并通過以下公式處理使所得回歸系數總和為1,從而獲得待評估鱗癌組織中各個細胞類型或細胞亞群類型的細胞組分含量百分比;
其中,P表示細胞組分含量百分比,Lm表示擬合回歸系數,i表示待評估鱗癌組織中的細胞類型或細胞亞群類型,j表示待評估鱗癌組織中的所有細胞類型或所有細胞亞群類型;
在計算擬合回歸系數之前,根據特征表達基因在各個細胞類型或細胞亞群類型內的基因表達量方差與該細胞類型或細胞亞群類型的平均文庫對特征表達基因施加權重,獲得樣本特征表達矩陣的附加特征數據,并將上述附加特征數據和樣本特征表達矩陣結合作為最終的樣本特征表達矩陣;其中,權重計算公式為:
其中,W為基因的權重得分,R為擬合殘差,Lm為擬合回歸系數,Lib為細胞類型或細胞亞群類型平均文庫,V為細胞類型或細胞亞群類型內的基因表達量方差,nu為常數1e-04。
2.根據權利要求1所述的一種鱗癌組織功能狀態與細胞組分評估方法,其特征在于,在計算擬合回歸系數之前,通過以下公式將待評估鱗癌組織中各個細胞類型或細胞亞群類型的細胞特征表達矩陣與樣本特征表達矩陣進行均值方差歸一化以消除矩陣間的量綱:
其中,x表示待評估鱗癌組織中各個細胞類型或細胞亞群類型的細胞特征表達矩陣;表示樣本特征表達矩陣的均值,σ表示樣本特征表達矩陣的標準差。
3.一種鱗癌組織功能狀態與細胞組分評估系統,其特征在于,包括:
數據獲取模塊,包括測序數據獲取子模塊和基因功能狀態獲取子模塊,所述測序數據獲取子模塊用于獲取鱗狀細胞癌組織單細胞測序數據,所述基因功能狀態獲取子模塊用于獲取14種單細胞組織功能狀態相關基因集;
聚類分析模塊,用于對所述單細胞測序數據進行無監督聚類分析,識別獲得包含以下細胞類型的單細胞樣本數據:B/Plasma細胞、T/NK細胞、內皮細胞、上皮細胞、成纖維細胞、Langerin樹突細胞、肥大細胞、成熟樹突細胞、黑色素細胞、漿細胞樣樹突細胞和單核細胞;對各個細胞類型的單細胞樣本數據進行無監督聚類分析,識別獲得各個細胞類型內的細胞亞群樣本數據;
組織功能狀態評估模塊,用于根據14種單細胞組織功能狀態相關基因集,對待評估鱗癌組織進行組織功能狀態的評估;所述組織功能狀態包括血管生成、細胞凋亡、細胞周期、細胞分化、DNA損傷、DNA修復、細胞上皮間質化、細胞缺氧、炎癥發生、癌細胞侵襲、癌細胞轉移、癌細胞增殖、細胞靜息、干細胞性;具體步驟包括:從CancerSEA數據庫中提取與組織功能狀態相關的14種單細胞組織功能狀態基因集并以其在CancerSEA數據庫中對應的編號數據集的數目作為權重;在待評估鱗癌組織的測序數據中提取14種功能狀態基因;以所述權重對每個功能狀態基因進行加權,并計算各個功能狀態基因的均值,從而獲得組織功能狀態的得分;
細胞組分評估模塊,用于根據所述單細胞樣本數據或各個細胞類型內的細胞亞群樣本數據對待評估鱗癌組織的各個細胞類型或各個細胞亞群類型進行細胞組分的評估;具體包括:通過基因差異表達分析,篩選獲得單細胞樣本數據或細胞亞群樣本數據中的樣本細胞特征表達基因;根據所述樣本細胞特征表達基因計算待評估鱗癌組織中各個細胞類型或細胞亞群類型的細胞特征表達基因的均值,輸出不同細胞類型或細胞亞群類型的浸潤含量評分;或者,
通過基因差異表達分析,篩選獲得單細胞樣本數據或細胞亞群樣本數據中的細胞特征表達基因,并生成樣本特征表達矩陣;根據特征表達基因在各個細胞類型或細胞亞群類型內的基因表達量方差與該細胞類型或細胞亞群類型的平均文庫對特征表達基因施加權重,獲得樣本特征表達矩陣的附加特征數據,并將上述附加特征數據和樣本特征表達矩陣結合作為最終的樣本特征表達矩陣;權重計算公式為:
其中,W為基因的權重得分,R為擬合殘差,Lm為擬合回歸系數,Lib為細胞類型或細胞亞群類型平均文庫,V為細胞類型或細胞亞群類型內的基因表達量方差,nu為常數1e-04;
通過非負線性最小二乘回歸方法計算待評估鱗癌組織中各個細胞類型或細胞亞群類型的細胞特征表達矩陣與樣本特征表達矩陣的擬合回歸系數,通過不斷迭代獲得最終擬合回歸系數,并通過以下公式處理使所得回歸系數總和為1,從而獲得待評估鱗癌組織中各個細胞類型或細胞亞群類型的細胞組分含量百分比;
其中,P表示細胞組分含量百分比,Lm表示擬合回歸系數,i表示待評估鱗癌組織中的細胞類型或細胞亞群類型,j表示待評估鱗癌組織中的所有細胞類型或所有細胞亞群類型。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于哈爾濱市米杰生物科技有限公司,未經哈爾濱市米杰生物科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110884396.0/1.html,轉載請聲明來源鉆瓜專利網。





