[發明專利]一種基于二次過濾的遺傳代謝病特異性指標挖掘方法在審
| 申請號: | 202011137209.4 | 申請日: | 2020-10-22 |
| 公開(公告)號: | CN112151193A | 公開(公告)日: | 2020-12-29 |
| 發明(設計)人: | 尹建偉;林博;舒強;李瑩;鄧水光;蔣萍萍 | 申請(專利權)人: | 浙江大學 |
| 主分類號: | G16H50/80 | 分類號: | G16H50/80;G16H50/70;G16H50/50;G06N20/00 |
| 代理公司: | 杭州求是專利事務所有限公司 33200 | 代理人: | 萬尾甜;韓介梅 |
| 地址: | 310058 浙江*** | 國省代碼: | 浙江;33 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 二次 過濾 遺傳 謝病 特異性 指標 挖掘 方法 | ||
本發明公開了一種基于二次過濾的遺傳代謝病特異性指標挖掘方法,該方法利用預設規則構建候選指標集,設計過濾函數和精練函數評估候選指標集之間、候選指標集內部的特異性程度,通過不斷迭代自動挖掘出遺傳代謝病相關的特異性指標,提高篩查指標的多樣性和篩查的準確度。本發明方法挖掘得到的特異性指標能夠將初篩假陽性率降低至1%左右。
技術領域
本發明屬于信息技術領域,具體涉及一種基于二次過濾的遺傳代謝病特異性指標挖掘方法。
背景技術
隨著生物技術的發展,串聯質譜法逐漸成為遺傳代謝病的主要篩查方法。在一次實驗室檢驗中,串聯質譜法可以同時測定幾十種遺傳代謝病相關代謝物的血液濃度(篩查指標),對數十種遺傳代謝病做出同步診斷。但在現有的篩查系統中,對于某一種遺傳代謝病所使用的特異性指標一般不會超過五個,導致篩查指標使用效率低下,多樣性不足,間接影響了篩查的準確度。
現階段,遺傳代謝病特異性指標的選取主要來自業界共識、相關醫學文獻和醫生臨床經驗。這些方法往往依靠醫學專家對指標進行人工分析,選取單個指標或指標比值,難以同時考慮幾十種篩查指標之間、與疾病之間復雜的關聯關系。相對地,隨著機器學習和統計理論的廣泛應用,數據驅動的特異性指標挖掘方法能夠自動高效地發現篩查指標的關聯,解決以往依靠人工尋找指標的問題。然而,現有方法還存在類型單一(基于模型、基于統計、基于搜索其中一種)和計算過程單一(一次性計算,沒有迭代精煉結果)的問題。
為此,本發明結合統計理論和機器學習模型,提出了一種多次迭代過濾的特異性指標挖掘方法。首先,本發明通過一系列預設規則來構建候選指標集,使可供搜索的篩查指標更為豐富;其次,本發明提出了基于候選指標集合的二次篩選方法,使篩選得到的篩查指標關聯性更強;最后,通過不斷迭代篩選,得到一系列特異性強的篩查指標,在一定程度上提高整體篩查的準確度。
發明內容
目前遺傳代謝病的篩查指標主要依靠人工分析和選取,難以同時考慮幾十種指標之間的復雜關系,導致現有特異性篩查指標存在數量少、多樣性不足、使用率低的問題。本發明提供了一種基于二次過濾的遺傳代謝病特異性指標挖掘方法,利用預設規則構建候選指標集,設計過濾函數和精練函數評估候選指標集之間、候選指標集內部的特異性程度,通過不斷迭代自動挖掘出遺傳代謝病相關的特異性指標,提高篩查指標的多樣性和篩查的準確度。
一種基于二次過濾的遺傳代謝病特異性指標挖掘方法,包含以下步驟:
1.候選指標集構建
1)根據臨床篩查指標和篩查對象的信息,構建兩組種子指標集:A,B;其中A表示氨基酸指標,B表示肉堿指標;N(A)表示A包含的指標個數,N(B)表示B包含的指標個數;
2)對于種子指標集A中的任意一個種子指標Ai,其中1≤i≤N(A),構建Ai所屬的候選指標集Cand(Ai);其中Cand(Ai)的構建方法為:(1)將Ai、Ai的平方、Ai的對數加入Cand(Ai);(2)將Ai+Aj、Ai/Aj加入Cand(Ai),其中Aj為A中除了Ai以外的N(A)-1個種子指標;(3)將(Ai+Aj)/Ak、Ak/(Ai+Aj)加入Cand(Ai),其中Aj為A中除了Ai以外的N(A)-1個種子指標,Ak為A中除了Ai和Aj以外的N(A)-2個種子指標;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于浙江大學,未經浙江大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011137209.4/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:具有冰感機制的負壓按摩裝置及其按摩棒
- 下一篇:一種超低功耗爆管檢測裝置





