[發明專利]一種基于機器學習的藥品風險分級評估方法有效
| 申請號: | 201811030444.4 | 申請日: | 2018-09-05 |
| 公開(公告)號: | CN109273096B | 公開(公告)日: | 2021-07-13 |
| 發明(設計)人: | 魏建香;劉天宇;劉美含 | 申請(專利權)人: | 南京郵電大學 |
| 主分類號: | G16H70/40 | 分類號: | G16H70/40 |
| 代理公司: | 南京蘇科專利代理有限責任公司 32102 | 代理人: | 牛莉莉 |
| 地址: | 210003 江蘇*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 機器 學習 藥品 風險 分級 評估 方法 | ||
1.一種基于機器學習的藥品風險分級評估方法,其特征在于:包括以下步驟:
步驟1),獲取原始ADR數據庫,并進行數據處理:其中原始ADR數據庫為國家中心的ADR數據;數據的處理包括對原始ADR數據庫進行規整以及篩選報告頻次大于等于3的數據;
步驟2),查閱資料,探索影響藥品不良反應風險等級大小的相關因素;并按照以下三個因素作為評判標準:T1:嚴重報告率,T2:傷害度指數,T3:ADR覆蓋率;
步驟3),對數據進行人工標注,結合臨床專家經驗、國家不良反應信息通報、病例報道、醫學文獻、國際藥物警戒專業網站信息對部分的常規用藥進行打分,分值為0-5分,擬分五個等級:[0,1]為A級;[1,2]為B級;[2,3]為C級;[3,4]為D級;[4,5]為E級;并將標注后的數據集作為訓練數據;
步驟4),由步驟3中獲得的訓練數據建立風險等級評價指標T,T=α1T1+α2T2+α3T3,約束條件:α1+α2+α3=1且αi∈(0,1),i=1~3;
以標準數據集為參考目標,利用群體智能優化算法對指標中的三個參數α1,α2,α3進行優化,優化過程中需要將T規格化為[0,5]之間,得到最優權重;
步驟5),將三種因素T1,T2,T3按照權重公式進行定義,引入風險程度的概念,定義為T;以藥品不良反應監測數據為基礎,以優化后的指標T對總體數據進行標注,以“藥品”為對象,以“不良反應”為特征,構建藥品在不良反應特征空間分布的數據集D,用于機器學習;
步驟6),利用數據集D和多類分類技術進行分類學習,得到分類精度≥85%的分類模型;該分類模型可以對新上市藥品的風險等級值進行預測。
2.根據權利要求1所述的基于機器學習的藥品風險分級評估方法,其特征在于,所述步驟1的詳細步驟如下:
步驟1)
步驟1.1),獲取原始ADR數據庫,原始ADR數據從國家藥品不良反應監測中心獲得;本數據是國家藥品評價中心藥品不良反應自發呈報系統數據庫2010~2011年采集的不良反應報告,作為分析數據;
步驟1.2),數據處理;
步驟1.2.1),針對原始數據存在缺項、重復、藥品名稱和不良反應名稱不規范的問題,將數據中的缺項記錄進行刪除,重復項做唯一化處理,不規范的名稱重新規范化;
步驟1.2.2),用Microsoft Visual FoxPro軟件對數據進行預處理,篩選數據量≥3的西藥數據,按照品種名稱和不良反應名稱對應形成新的表格。
3.根據權利要求2所述的基于機器學習的藥品風險分級評估方法,其特征在于:所述步驟1.2.2)中共有1763種藥品以及對應的879種不良反應。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于南京郵電大學,未經南京郵電大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811030444.4/1.html,轉載請聲明來源鉆瓜專利網。





