[發明專利]基于臨床特征和序列變異的單基因病名稱推薦方法及系統有效
| 申請號: | 202010511089.3 | 申請日: | 2020-06-08 |
| 公開(公告)號: | CN111883210B | 公開(公告)日: | 2021-05-25 |
| 發明(設計)人: | 馬旭;曹宗富;羅敏娜;陳翠霞;蔡瑞琨;喻浴飛;李乾 | 申請(專利權)人: | 國家衛生健康委科學技術研究所 |
| 主分類號: | G16B30/10 | 分類號: | G16B30/10;G16B20/40;G16B50/00;G06K9/62 |
| 代理公司: | 北京市萬慧達律師事務所 11111 | 代理人: | 黃玉東 |
| 地址: | 100081 *** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 臨床 特征 序列 變異 基因 名稱 推薦 方法 系統 | ||
1.一種基于臨床特征和序列變異的單基因病名稱推薦方法,其特征在于,包括:
獲取患者的病例信息,所述病例信息包括基因序列、特征集合I和單基因病名稱;
將所述基因序列與人類參考基因組進行比對得到比對數據,并根據比對數據得到每個遺傳變異的影響性評分;
遍歷特征關系數據庫中各標準單基因病名稱對應的特征集合A,分別計算每個特征集合A與特征集合I的集合相似度值,并按相似度值大小將相似的標準單基因病名稱及對應的基因降序候選輸出,同時匯總候選輸出的標準單基因病名稱構建標準單基因病名稱集合P;
從預設的基因列表文件中獲取與所述單基因病名稱對應的多個基因,基于所述基因中各遺傳變異的影響性評分、遺傳變異的遺傳模式、已知疾病的關聯性和所述基因對應的相似度值分別計算每個所述基因的致病性評分,并按照致病性評分值大小將對應的標準單基因病名稱降序候選輸出,同時匯總候選輸出的標準單基因病名稱構建標準單基因病名稱集合G;
基于標準單基因病名稱集合G和標準單基因病名稱集合P的交集結果,以及標準單基因病名稱的候選輸出順序,輸出標準單基因病名稱的推薦結果;
遍歷特征關系數據庫中各標準單基因病名稱對應的特征集合A,分別計算每個特征集合A與特征集合I的集合相似度值,并按相似度值大小將相似的標準單基因病名稱及對應的基因降序候選輸出的方法包括:
將特征集合I中的臨床特征在標準化臨床特征表型樹上的節點標記;
遍歷特征關系數據庫中的第n個標準單基因病名稱,將其對應的特征集合A中的標準臨床特征在標準化臨床特征表型樹上的節點標記,所述n的初始值為1;
基于標準化臨床特征表型樹上的節點標記,從特征集合A中匹配出與特征集合I中每個臨床特征對應的最佳標準臨床特征;
根據每個臨床特征與對應的最佳標準臨床特征的相似度值,計算出特征集合I與當前特征集合A的集合相似度值;
令n=n+1重新遍歷特征關系數據庫中的第n個標準單基因病名稱,直至特征關系數據庫中的標準單基因病名稱遍歷完畢,將特征集合I與每個特征集合A對應的集合相似度值匯總排序候選輸出;
基于標準化臨床特征表型樹上的節點標記,從特征集合A中匹配出與特征集合I中每個臨床特征對應的最佳標準臨床特征的方法包括:
所述特征集合I包括多個臨床特征,所述特征集合A包括多個標準臨床特征;
遍歷所述特征集合I中的第i個臨床特征,從所述特征集合A中篩選出與所述第i個臨床特征相似度最高的標準臨床特征,作為與所述第i個臨床特征對應的最佳標準臨床特征,所述i的初始值為1;
令i=i+1后重新遍歷所述特征集合I中的第i個臨床特征,直至特征集合I中的臨床特征遍歷完畢,從第n個標準單基因病名稱對應的特征集合A中篩選出與特征集合I中臨床特征一一對應的多個最佳標準臨床特征;
從所述特征集合A中篩選出與所述第i個臨床特征相似度最高的標準臨床特征的方法包括:
遍歷所述特征集合A中的第j個標準臨床特征,基于已建立的索引判斷所述第j個標準臨床特征與所述第i個臨床特征是否存在相同的干節點Bt,所述j的初始值為1;
若判斷結果為否,則認為所述第j個標準臨床特征與所述第i個臨床特征的相似度值為零;
若判斷結果為是,基于多層級結構相似度算法計算所述第j個標準臨床特征與所述第i個臨床特征的相似度值;
令j=j+1后重新遍歷所述特征集合A中的第j個標準臨床特征,并繼續執行所述第j個標準臨床特征與所述第i個臨床特征的相似度計算,直至所述特征集合A中的標準臨床特征遍歷完畢,對應得到與所述特征集合A中標準臨床特征一一對應的多個相似度值;
從多個相似度值篩中篩選出最大值對應的標準臨床特征作為與第i個臨床特征對應的最佳標準臨床特征;
基于多層級結構相似度算法計算第j個標準臨床特征與第i個臨床特征的相似度值的方法包括:
基于標準化臨床特征表型樹上的節點標記,獲取第i個臨床特征與相同干節點Bt連接通路中所有節點的有向集合IB,以及獲取第j個標準臨床特征相同干節點Bt連接通路中所有節點的有向集合AB,有向集合IB長度的值為通路中節點的個數LIB,有向集合AB長度的值為通路中節點的個數LAB;提取有向集合IB和有向集合AB中節點的交集IAB,交集IAB長度的值為通路中共有節點的個數LIAB;采用公式SIiAj=β·SM+(1-β)·SI計算第j個標準臨床特征與第i個臨床特征的相似度值;
其中,SM表示第j個標準臨床特征與第i個臨床特征在表型樹多層次間的相似度值;SI表示第j個標準臨床特征與第i個臨床特征在表型樹同層次間的相似度值,β為權重系數。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于國家衛生健康委科學技術研究所,未經國家衛生健康委科學技術研究所許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010511089.3/1.html,轉載請聲明來源鉆瓜專利網。





