[發(fā)明專利]基于空間可分離性的利用基因檢測的疾病預(yù)測方法及系統(tǒng)在審
| 申請?zhí)枺?/td> | 202010616721.0 | 申請日: | 2020-07-01 |
| 公開(公告)號: | CN111755076A | 公開(公告)日: | 2020-10-09 |
| 發(fā)明(設(shè)計)人: | 杜強;李德軒;郭雨晨;聶方興;張興;唐超 | 申請(專利權(quán))人: | 北京小白世紀(jì)網(wǎng)絡(luò)科技有限公司 |
| 主分類號: | G16B40/20 | 分類號: | G16B40/20;G16H50/30 |
| 代理公司: | 北京八月瓜知識產(chǎn)權(quán)代理有限公司 11543 | 代理人: | 李斌 |
| 地址: | 100083 北京市海淀區(qū)*** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 基于 空間 可分離 利用 基因 檢測 疾病 預(yù)測 方法 系統(tǒng) | ||
1.基于空間可分離性的利用基因檢測的疾病預(yù)測方法,其特征在于,包括以下步驟:
獲取人體基因及基因檢測數(shù)據(jù);系統(tǒng)通過MAX函數(shù)確定每個基因?qū)?yīng)的各種病種的值域,對比每個基因的各個病種的值域范圍是否發(fā)生重疊,確定獲得具有能甄別特定病種的基因;系統(tǒng)提取各具有能甄別特定病種的基因的數(shù)值,將對應(yīng)的各基因的行數(shù)據(jù)進行標(biāo)準(zhǔn)化處理;根據(jù)標(biāo)準(zhǔn)化處理后的各具有能甄別特定病種的基因的行數(shù)據(jù),系統(tǒng)計算每個具有能甄別特定病種的基因?qū)?yīng)的每個病種的數(shù)值范圍的均值及該基因?qū)?yīng)的所有病種數(shù)值范圍的均值;再計算該具有能甄別特定病種的基因?qū)?yīng)的所有病種數(shù)值范圍的均值與該基因能甄別的病種數(shù)值范圍的均值的距離期望,即獲得各具有能甄別特定病種的基因的離散值;將各離散值進行排序,剔除顯著低于0.1的具有能甄別特定病種的基因,獲得顯著基因;將顯著基因按照其能甄別的病種進行分類,并對同一類顯著基因的離散值進行正則化,得到正則化后的離散值;系統(tǒng)通過python的基本命令語句計算得到各顯著基因所能甄別的病種的數(shù)值范圍的值域及剩下的病種的數(shù)值范圍的值域,確定每個顯著基因的閾值;對每個顯著基因?qū)?yīng)的病種設(shè)置一個初始預(yù)測得分為0;系統(tǒng)將每個顯著基因的數(shù)值與閾值進行比較,得到每個病種對應(yīng)的最終預(yù)測得分,根據(jù)預(yù)測得分,判斷患病的幾率。
2.如權(quán)利要求1所述的基于空間可分離性的利用基因檢測的疾病預(yù)測方法,其特征在于,所述系統(tǒng)通過MAX函數(shù)確定每個基因?qū)?yīng)的各種病種的值域,對比每個基因的各個病種的值域范圍是否發(fā)生重疊,確定獲得具有能甄別特定病種的基因具體為:
對基因檢測數(shù)據(jù)以基因為單位進行遍歷,通過MAX函數(shù)確定每個基因?qū)?yīng)的各種病種的最大值和最小值,確定其值域范圍;根據(jù)比對單個基因?qū)?yīng)的各個病種的值域范圍是否發(fā)生重疊,若沒有發(fā)生重疊,則該基因為具有能甄別特定病種的基因。
3.如權(quán)利要求1所述的基于空間可分離性的利用基因檢測的疾病預(yù)測方法,其特征在于,所述將對應(yīng)的各基因的行數(shù)據(jù)進行標(biāo)準(zhǔn)化處理包括如下步驟:
首先通過max函數(shù)算出單個具有能甄別特定病種的基因?qū)?yīng)的行數(shù)據(jù)的最大值和最小值,通過最大值減去最小值得到差值,再將該行數(shù)據(jù)減去最小值并與差值相除,得到該行數(shù)據(jù)的正則值。
4.如權(quán)利要求1所述的基于空間可分離性的利用基因檢測的疾病預(yù)測方法,其特征在于,所述對同一類顯著基因的離散值進行正則化包括步驟:
確定病種對應(yīng)的所有顯著基因的離散值的最大值,使用每個顯著基因的離散值除以其最大值,得到正則化后的離散值。
5.如權(quán)利要求1所述的基于空間可分離性的利用基因檢測的疾病預(yù)測方法,其特征在于,所述確定每個顯著基因的閾值包括以下步驟:
系統(tǒng)通過python的基本命令語句計算得到該顯著基因所能甄別的病種的數(shù)值范圍的最大值a和最小值b;
再計算剩下的病種的數(shù)值范圍的最大值c和最小值d,每個顯著基因的閾值確認(rèn)包括以下兩種情況:
第一種情況是b>c時,那么顯著基因的閾值等于b-(a-b)/(a-b+c-d)*(b-c);
第二種情況是a<d時,那么顯著基因的閾值等于a+(a-b)/(a-b+c-d)*(d-a)。
6.如權(quán)利要求1所述的基于空間可分離性的利用基因檢測的疾病預(yù)測方法,其特征在于,所述系統(tǒng)將每個顯著基因的數(shù)值與其閾值進行比較,得到每個病種對應(yīng)的最終預(yù)測得分包括以下兩種情況:
第一種情況:顯著基因所能甄別的病種的數(shù)值范圍最大值小于其閾值,因此該病種的最終得分為預(yù)測得分加上該顯著基因?qū)?yīng)的正則化后的離散值;反之,丟棄該顯著基因;
第二種情況:如果該顯著基因所能甄別的病種的數(shù)值范圍最小值大于其閾值,那么該病種的最終得分為預(yù)測得分應(yīng)該加上該顯著基因?qū)?yīng)的正則化后的離散值,反之丟棄該顯著基因。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于北京小白世紀(jì)網(wǎng)絡(luò)科技有限公司,未經(jīng)北京小白世紀(jì)網(wǎng)絡(luò)科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010616721.0/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





