[發(fā)明專(zhuān)利]一種精神分裂癥遺傳風(fēng)險(xiǎn)分型試劑盒及分型裝置有效
| 申請(qǐng)?zhí)枺?/td> | 202010501829.5 | 申請(qǐng)日: | 2020-06-04 |
| 公開(kāi)(公告)號(hào): | CN111733229B | 公開(kāi)(公告)日: | 2022-09-30 |
| 發(fā)明(設(shè)計(jì))人: | 張程程 | 申請(qǐng)(專(zhuān)利權(quán))人: | 四川大學(xué)華西醫(yī)院 |
| 主分類(lèi)號(hào): | C12Q1/6883 | 分類(lèi)號(hào): | C12Q1/6883;C12N15/11;G16B5/00;G16B20/00 |
| 代理公司: | 成都高遠(yuǎn)知識(shí)產(chǎn)權(quán)代理事務(wù)所(普通合伙) 51222 | 代理人: | 李高峽;張娟 |
| 地址: | 610000 四*** | 國(guó)省代碼: | 四川;51 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 精神分裂癥 遺傳 風(fēng)險(xiǎn) 試劑盒 裝置 | ||
1.檢測(cè)如下54個(gè)基因的SNP的檢測(cè)試劑在制備精神分裂癥遺傳風(fēng)險(xiǎn)分型裝置中的用途:
SLC5A7基因、SYNGAP1基因、TMEM180基因、LRP4基因、FXR1基因、FAT3基因、GPM6A基因、BAIAP2基因、FGFR1基因、EPHA5基因、ACTR1A基因、AATK基因、SGCE基因、LETM2基因、HCN1基因、INA基因、SUFU基因、DCBLD1基因、PPARGC1A基因、BAG4基因、C11orf91基因、LSM1基因、S100B基因、ITPR3基因、MAGI2基因、STRN基因、DENND1A基因、RTN1基因、PLK3基因、IFT57基因、EIF2B3基因、HSPE1-MOB4基因、YWHAG基因、AMFR基因、MOB4基因、GRM7基因、BOK基因、JADE2基因、PEG10基因、NDUFV2基因、ARL2BP基因、SLC4A2基因、CD59基因、EGR2基因、CAT基因、LZTS1基因、EPHB2基因、GOPC基因、VSIG2基因、LRP1基因、CPT1C基因、GNAI1基因、ELAC2基因和 TCTEX1D4基因;
所述分型裝置還包括分析基因SNP模式的分析裝置;
所述分析裝置內(nèi)置數(shù)據(jù)輸入端口,用于接收前述檢測(cè)裝置的檢測(cè)結(jié)果;
所述分析裝置內(nèi)置數(shù)據(jù)質(zhì)量控制、預(yù)測(cè)插補(bǔ)及分析模型,用于SNP質(zhì)控;
數(shù)據(jù)前處理步驟為:
首先,樣本質(zhì)控:去除分型成功率<98%、重復(fù)或有血緣關(guān)系樣本;利用EIGENSTART軟件進(jìn)行主成分分析檢驗(yàn)病例對(duì)照匹配度;
其次,進(jìn)行SNP質(zhì)控:去除分型成功率<90%、等位基因頻率<1%、偏離遺傳平衡檢驗(yàn)對(duì)照HWE P≤10-7;
再次,進(jìn)行預(yù)測(cè)插補(bǔ)Imputation分析:采用Sanger Imputation服務(wù)器,以單體型參考聯(lián)盟1.1版Haplotype Reference Consortium version 1.1作為參考模板進(jìn)行全基因組Imputation, Imputation數(shù)據(jù)再次進(jìn)行SNP質(zhì)控:多等位基因變異和插入信息得分(INFO)<0.3的SNP被排除,得到基于預(yù)處理后imputation的基因型數(shù)據(jù);
所述分析裝置內(nèi)置了多基因遺傳風(fēng)險(xiǎn)評(píng)分預(yù)測(cè)模型,用于計(jì)算多閾值多基因遺傳風(fēng)險(xiǎn)的指標(biāo)分量;
其中,多閾值多基因遺傳風(fēng)險(xiǎn)的指標(biāo)分量的確定步驟為:
取基于預(yù)處理后imputation的基因型數(shù)據(jù),計(jì)算基于個(gè)體的基因組合的PRS如下:
,
ωij為第i個(gè)SNP觀察基因型j的概率,其中j∈{0,1,2};m是snp的數(shù)量;和βi是根據(jù)PGC精神遺傳聯(lián)盟精神分裂癥亞洲人群的全基因組關(guān)聯(lián)研究GWAS數(shù)據(jù)估計(jì)的第i個(gè)SNP的效應(yīng)大小;
進(jìn)一步針對(duì)上述PRS進(jìn)行最終預(yù)測(cè)模型參數(shù)優(yōu)化,計(jì)算優(yōu)化PRS關(guān)聯(lián)對(duì)應(yīng)的經(jīng)驗(yàn)p值,通過(guò)控制1型錯(cuò)誤率避免出現(xiàn)過(guò)擬合:
,
其中N為排列次數(shù);I(.)為指標(biāo)函數(shù),當(dāng)排列n的最優(yōu)擬合PRS的p值小于觀察到的p值、Po和0時(shí),為1;為了避免p值為0的經(jīng)驗(yàn)值,將1的偽計(jì)數(shù)加到分子和分母上,將觀察到的性狀配置計(jì)數(shù)為1個(gè)潛在的空排列,關(guān)聯(lián)經(jīng)驗(yàn)p值控制1型錯(cuò)誤率;
使用10,000個(gè)置換檢驗(yàn)來(lái)生成每個(gè)GWAS經(jīng)驗(yàn)的p值閾值,即從5E-08到1的估計(jì)值,每個(gè)排列測(cè)試都提供了一個(gè)Nagelkerke的R2,Nagelkerke的R2被用來(lái)選擇PT;年齡、性別和人口分層分析的前三個(gè)主成分作為協(xié)變量,為每個(gè)被試構(gòu)建一個(gè)5維特征向量作為多閾值遺傳風(fēng)險(xiǎn)分量,提取每個(gè)被試R2最高的GWAS經(jīng)驗(yàn)p值閾值PT的PRS作為指標(biāo)分量,即得到多閾值多基因遺傳風(fēng)險(xiǎn)的指標(biāo)分量;
所述分析裝置內(nèi)置了由機(jī)器學(xué)習(xí)算法和多閾值多基因遺傳風(fēng)險(xiǎn)的指標(biāo)分量構(gòu)建的統(tǒng)計(jì)分析模型,用于判別精分裂癥多基因遺傳風(fēng)險(xiǎn)亞型;
構(gòu)建預(yù)測(cè)模型的步驟為:
先用無(wú)監(jiān)督層次聚類(lèi)分析多閾值多基因遺傳風(fēng)險(xiǎn)的指標(biāo)分量,得到聚類(lèi)結(jié)果;再用有監(jiān)督的支持向量機(jī)分類(lèi)算法,構(gòu)建精神分裂分類(lèi)模型;
A. 層次聚類(lèi)模型:
1)采用歐氏距離作為精神分裂癥樣本之間的距離度量,聚類(lèi)之間的平均距離作為連接函數(shù);
2)通過(guò)計(jì)算被試之間的歐氏距離,將相對(duì)接近的被試對(duì)連接成一個(gè)二元聚類(lèi);
3)利用Silhouette和Dunn指數(shù)反應(yīng)聚類(lèi)效果和最優(yōu)聚類(lèi)數(shù):
其中a(i)是從第ith個(gè)樣本到所在聚類(lèi)子集中與其他樣本的平均距離,b(i,k)是從第ith個(gè)樣本到另一個(gè)聚類(lèi)子集k中的樣本的平均距離, Silhouette索引的值在-1到1之間變化,值越高表明聚類(lèi)結(jié)果越好;
其中m是簇的數(shù)量,δ(Ci,Cj)是簇Ci和Cj之間的簇間距離,而是同一簇內(nèi)兩個(gè)樣本之間的最大距離, Dunn索引的值介于零和∞之間,Dunn索引的值越大,表示聚類(lèi)質(zhì)量越好;
當(dāng)聚類(lèi)數(shù)等于2時(shí),silhouette指數(shù)最大0.63, Dunn指數(shù)最大0.21,說(shuō)明在層次聚類(lèi)中最能代表數(shù)據(jù)結(jié)構(gòu)的最優(yōu)聚類(lèi)數(shù)為2;
4)利用bootstrap技術(shù)測(cè)試聚類(lèi)穩(wěn)定性,通過(guò)R中的“fpc”軟件包,計(jì)算Jaccard系數(shù)作為重采樣聚類(lèi)與原聚類(lèi)分析得到的聚類(lèi)之間的相似性,驗(yàn)證聚類(lèi)結(jié)果,當(dāng)聚類(lèi)數(shù)為2時(shí),Jaccard系數(shù)達(dá)到最高值0.76;
B. 有監(jiān)督的支持向量機(jī)構(gòu)建精神分裂分類(lèi)模型,具體步驟如下:
1)采用統(tǒng)計(jì)分析軟件R語(yǔ)言程序包“Caret”,調(diào)用支持向量機(jī)算法;
2)將支持向量機(jī)算法對(duì)指標(biāo)分量的聚類(lèi)結(jié)果進(jìn)行歸一化預(yù)處理,輸入支持向量機(jī);
3)支持向量機(jī)采用線性核函數(shù)linear kernel,構(gòu)建線性分類(lèi)模型,得精神分裂癥分類(lèi)模型;
結(jié)果判斷方法:取待測(cè)樣本,按照前述步驟1的方法檢測(cè)54個(gè)基因的SNP,進(jìn)行數(shù)據(jù)處理,得到多閾值多基因遺傳風(fēng)險(xiǎn)的指標(biāo)分量,利用無(wú)監(jiān)督層次聚類(lèi)分析聯(lián)合有監(jiān)督的支持向量機(jī)分類(lèi)算法,連接多閾值多基因遺傳風(fēng)險(xiǎn)的指標(biāo)分量特征裝置,輸入構(gòu)建精神分裂癥亞型分類(lèi)模型中,若輸出結(jié)果為正常,則判定待檢樣本患精神分裂癥的可能性較小;若結(jié)果輸出為I類(lèi),則判定精神分裂癥患者為亞類(lèi)I,預(yù)測(cè)亞類(lèi)I患精神分裂嚴(yán)重程度重;若結(jié)果輸出為II類(lèi),則判定精神分裂癥患者為亞類(lèi)II,預(yù)測(cè)亞類(lèi)II患精身分裂嚴(yán)重程度輕。
2.如權(quán)利要求1所述的用途,其特征在于:所述機(jī)器學(xué)習(xí)算法為層次聚類(lèi)和支持向量機(jī)算法。
該專(zhuān)利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專(zhuān)利權(quán)人授權(quán)。該專(zhuān)利全部權(quán)利屬于四川大學(xué)華西醫(yī)院,未經(jīng)四川大學(xué)華西醫(yī)院許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買(mǎi)此專(zhuān)利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010501829.5/1.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專(zhuān)利網(wǎng)。
- 一個(gè)與精神分裂癥密切相關(guān)聯(lián)的易感基因
- 精神分裂癥關(guān)聯(lián)基因
- 使用環(huán)酰胺衍生物治療精神分裂癥的方法
- 人參二醇皂苷組分的抗精神分裂癥醫(yī)藥用途
- 腸道微生物紊亂精神分裂癥動(dòng)物模型的構(gòu)建方法
- 一種氯胺酮誘導(dǎo)精神分裂癥動(dòng)物模型及其機(jī)制研究
- 24-羥基膽固醇在制備診斷或早期診斷精神分裂癥的產(chǎn)品中的用途
- 一種基于機(jī)器學(xué)習(xí)的難治性精神分裂癥風(fēng)險(xiǎn)的預(yù)測(cè)方法
- 一種區(qū)分首發(fā)精神分裂癥與抑郁癥共病的方法
- 基于精神分裂癥的用藥分析方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 風(fēng)險(xiǎn)監(jiān)視裝置、風(fēng)險(xiǎn)監(jiān)視系統(tǒng)、風(fēng)險(xiǎn)監(jiān)視方法
- 風(fēng)險(xiǎn)控制方法及風(fēng)險(xiǎn)控制裝置
- 風(fēng)險(xiǎn)分層
- 風(fēng)險(xiǎn)分層
- 風(fēng)險(xiǎn)判定裝置、風(fēng)險(xiǎn)判定方法以及風(fēng)險(xiǎn)判定程序
- 風(fēng)險(xiǎn)評(píng)價(jià)系統(tǒng)以及風(fēng)險(xiǎn)評(píng)價(jià)方法
- 風(fēng)險(xiǎn)管理裝置、風(fēng)險(xiǎn)管理方法以及風(fēng)險(xiǎn)管理程序
- 風(fēng)險(xiǎn)測(cè)算方法和風(fēng)險(xiǎn)測(cè)算系統(tǒng)
- 風(fēng)險(xiǎn)評(píng)估方法及風(fēng)險(xiǎn)評(píng)估裝置
- 風(fēng)險(xiǎn)評(píng)估方法及風(fēng)險(xiǎn)評(píng)估裝置





