[發(fā)明專利]對卵巢癌進(jìn)行篩查、診斷或風(fēng)險分級的方法和裝置在審
| 申請?zhí)枺?/td> | 201811030743.8 | 申請日: | 2018-09-05 |
| 公開(公告)號: | CN110880356A | 公開(公告)日: | 2020-03-13 |
| 發(fā)明(設(shè)計)人: | 魏國鵬 | 申請(專利權(quán))人: | 南京格致基因生物科技有限公司 |
| 主分類號: | G16B40/00 | 分類號: | G16B40/00;G16B25/00;G16B30/00;C12Q1/6886 |
| 代理公司: | 中國國際貿(mào)易促進(jìn)委員會專利商標(biāo)事務(wù)所 11038 | 代理人: | 韓威威 |
| 地址: | 210000 江蘇省南京市江北新區(qū)新*** | 國省代碼: | 江蘇;32 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 卵巢癌 進(jìn)行 診斷 風(fēng)險 分級 方法 裝置 | ||
1.用于對卵巢癌進(jìn)行篩查、診斷或風(fēng)險分級的一組染色體,該組染色體包含第1到第22號染色體中的至少1條。
2.根據(jù)權(quán)利要求1所述的一組染色體,其由第1到第22號人類染色體組成。
3.一種計算機可讀介質(zhì),其上存儲有指令,其中當(dāng)所述指令被處理器執(zhí)行時,使得計算機執(zhí)行以下操作:
根據(jù)來自受試者(例如人)的樣品的第1到22號染色體的染色體不平衡或染色體臂不平衡計算該受試者整體的不平衡度量CScore值;
結(jié)合CScore值和所述樣品中CA-125的水平,以判斷所述受試者是否患有卵巢癌或存在患卵巢癌的高風(fēng)險。
4.根據(jù)權(quán)利要求3所述的計算機可讀介質(zhì),其中通過以下方式計算CScore值:
將受試者(例如人)的全基因組數(shù)據(jù)序列(例如高通量測序技術(shù)獲得的全基因組數(shù)據(jù)序列)比對到參考基因組(例如人的參考基因組Hg19),并例如按照10-1000k/bin(例如50k/bin),平均分成多個段(例如bin);
分別計算第i號染色體長臂覆蓋到的段(例如bin)的讀長(reads)的平均數(shù)(covChriq)和染色體短臂覆蓋到的段(例如bin)的讀長(reads)的平均數(shù)(covChrip);
根據(jù)下列公式,計算第i號染色體的R值
或
其中q代表長臂,p代表短臂,Chr為染色體(chromosome)的縮寫,i選自1到22號染色體;
基于R值,根據(jù)公式(2)計算第i號染色體的Z-score(ZChri):
其中是健康人群所對應(yīng)的R值的平均數(shù),是健康人群所對應(yīng)的R值的標(biāo)準(zhǔn)偏差;
或者,根據(jù)公式(3a)和(3b)計算第i號染色體相應(yīng)長臂q的和短臂p的
其中是健康人群所對應(yīng)的第i號染色體長臂的讀長的平均數(shù),是健康人群所對應(yīng)的第i號染色體短臂的讀長的平均數(shù);
如果第i號染色體或染色體臂的Z-score的絕對值大于等于3,則認(rèn)為該染色體或染色體臂存在不平衡;選擇染色體或染色體臂Z-score的絕對值大于等于3的染色體,根據(jù)公式(4),求整體的不平衡度量CScore值:
5.根據(jù)權(quán)利要求3或4所述的計算機可讀介質(zhì),其中利用CScore和CA-125的水平建立決策樹模型,對卵巢癌風(fēng)險進(jìn)行預(yù)測。
6.根據(jù)權(quán)利要求3或4所述的計算機可讀介質(zhì),其中通過R語言建立決策樹模型。
7.根據(jù)權(quán)利要求6所述的計算機可讀介質(zhì),其中以下步驟建立決策樹模型:
(1)構(gòu)建整體樣本數(shù)據(jù)集,在該整體樣本數(shù)據(jù)集中約50%為卵巢癌樣本、約50%為卵巢良性腫瘤樣本;
(2)拆分?jǐn)?shù)據(jù),使用R中隨機抽樣函數(shù)“sample”對整體樣本數(shù)據(jù)集進(jìn)行分割,分別構(gòu)建訓(xùn)練集和測試集,其中訓(xùn)練集占整體樣本的約60%,測試集占整體樣本的約40%;
(3)分類樹訓(xùn)練數(shù)據(jù);
(4)確定決策樹模型的最優(yōu)參數(shù);
(5)任選地,使用決策樹模型及相應(yīng)最優(yōu)參數(shù)對測試集數(shù)據(jù)進(jìn)行檢驗,確定模型最優(yōu)參數(shù)的效果如何。
8.根據(jù)權(quán)利要求7所述的計算機可讀介質(zhì),其中通過以下方式構(gòu)建整體樣本數(shù)據(jù)集:選取樣本,將各樣本按照CScore、CA-125的水平、類型Type屬性和樣本號構(gòu)建整體樣本數(shù)據(jù)集。
9.根據(jù)權(quán)利要求7所述的計算機可讀介質(zhì),其中通過以下方式進(jìn)行分類樹訓(xùn)練數(shù)據(jù)并確定決策樹模型的最優(yōu)參數(shù):使用R中party包的條件推斷決策樹ctree對訓(xùn)練集進(jìn)行建模,條件為CScore和CA-125,標(biāo)簽為類型Type,ctree包輪流重復(fù)選取樣本數(shù)據(jù)中條件屬性的值作為分割點、閾值來分類,最后生成該模型的最優(yōu)參數(shù)。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于南京格致基因生物科技有限公司,未經(jīng)南京格致基因生物科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811030743.8/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 風(fēng)險監(jiān)視裝置、風(fēng)險監(jiān)視系統(tǒng)、風(fēng)險監(jiān)視方法
- 風(fēng)險控制方法及風(fēng)險控制裝置
- 風(fēng)險分層
- 風(fēng)險分層
- 風(fēng)險判定裝置、風(fēng)險判定方法以及風(fēng)險判定程序
- 風(fēng)險評價系統(tǒng)以及風(fēng)險評價方法
- 風(fēng)險管理裝置、風(fēng)險管理方法以及風(fēng)險管理程序
- 風(fēng)險測算方法和風(fēng)險測算系統(tǒng)
- 風(fēng)險評估方法及風(fēng)險評估裝置
- 風(fēng)險評估方法及風(fēng)險評估裝置





