[發明專利]基于決策樹分層的藥品不良反應數據遮蔽效應消除的方法有效
| 申請號: | 202010841630.7 | 申請日: | 2020-08-20 |
| 公開(公告)號: | CN112133450B | 公開(公告)日: | 2022-08-23 |
| 發明(設計)人: | 魏建香;阮倩昀;盧志強 | 申請(專利權)人: | 南京郵電大學 |
| 主分類號: | G16H70/40 | 分類號: | G16H70/40;G16H10/40 |
| 代理公司: | 南京蘇科專利代理有限責任公司 32102 | 代理人: | 牛莉莉 |
| 地址: | 210003 江蘇*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 決策樹 分層 藥品 不良反應 數據 遮蔽 效應 消除 方法 | ||
本發明公開了一種基于決策樹分層的藥品不良反應數據遮蔽效應消除的方法,所述方法以中國藥品不良反應即ADR報告數據為基礎,研究基于決策樹分層的藥品不良反應數據遮蔽效應消除的問題,設計了基于標準庫的評價指標并構建了實現多級分層的決策樹,以MHRA信號檢測方法來比較分層前后數據集信號檢測的差異性,最終給出了實現削減藥品不良反應數據遮蔽效應的基于決策樹的多級分層策略。本發明為中國藥品不良反應報告進行信號檢測中數據遮蔽效應的消除提供了一種可參考方法。
技術領域
本發明屬于信號檢測領域,具體涉及一種用于我國的基于決策樹分層的藥品不良反應數據遮蔽效應消除的方法。
背景技術
目前的自發呈報數據庫中ADR數量龐大、種類多樣,信號檢測易受到混雜因子的影響,從而導致一些重要的信號被遮蔽,這將影響信號檢測的準確性。有關藥品-不良反應報告的分層研究表明,與直接對未分層的數據做信號檢測相比,分層將揭示出藥品與不良反應事件之間新的關聯關系,有利于減弱混雜因子遮蔽信號的影響。
此外,現有的分層研究是將混雜因子對信號檢測的影響進行了獨立地研究,而在自發呈報數據庫數量龐大、種類多樣的背景下,多個混雜因子會對信號檢測有不同程度的影響,因此在分層的過程中綜合考慮多個混雜因子,有利于發現藥品和不良反應之間新的關聯關系。
發明內容
解決的技術問題:本發明在分層的過程中綜合考慮多個混雜因子,提出一種基于決策樹分層的藥品不良反應數據遮蔽效應消除的方法。該方法是指采用構造決策樹的流程,將藥品不良反應數據集按照三個混雜因子進行多級分層,并對分層后的數據子集做信號檢測處理,將此結果與分層前的信號檢測結果作比較,從而分析基于決策樹的多級分層方法削弱數據遮蔽效應的能力。
技術方案:一種基于決策樹分層的藥品不良反應數據遮蔽效應消除的方法,所述方法包括以下步驟:
1)數據的采集:數據的采集包括原始ADR數據的采集和標準庫的采集;
2)數據的預處理:數據的預處理包括對所述原始ADR數據中的不良反應名稱規范為標準庫中包括的不良反應名稱,刪除標準庫中未包括的藥品及其所述未包括藥品的不良反應數據,統一化混雜因子所在的字段值,添加藥品不良反應是否出現在標準庫的字段“是否已知”,記錄重復的藥品不良反應組合數;
3)構建多級分層的決策樹:將原始ADR數據的四個特征“性別”、“年齡”、“是否屬于抗生素類”和“地區”視為混雜因子。由于待研究的混雜因子過多時,分層會過細,對信號檢測效能產生負面影響。而混雜因子數量過少使得無法有效地均衡不同特征數據之間的差異,因此確定待研究的混雜因子個數為3。為了確定主要的三個混雜因子,從上述四個混雜因子中任選三個作為數據的特征,進行下述構建決策樹的過程。將“是否已知”字段作為決策任務的類標簽,利用WEKA軟件中的J48分類算法構建決策樹,根據每一個子類中數據實際的類別和預測的類別不一致的比例,來分析分類的精度。再次選擇三個不同的混雜因子,重復構建多級分層的決策樹的步驟。最后,選擇分類精度最高的一組混雜因子;
4)信號檢測:從所構建的決策樹中得到分類的規則,即將ADR數據按照三個混雜因子的優先順序分類,根據分類的規則從數據集中提取出每一個子類中的數據,即數據子集,采用信號檢測方法分別對數據集和數據子集進行信號檢測,從而獲得兩個信號集,總樣本的信號檢測結果對應信號集1,子樣本各自做信號檢測后整合的結果對應信號集2;
5)性能評估:以標準庫作為檢驗的標準,設計評價指標,對兩個信號集進行性能評估,分析基于決策樹的多級分層方法在削弱數據遮蔽效應方面發揮的作用。
501)設計基于標準庫的四格表
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于南京郵電大學,未經南京郵電大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010841630.7/2.html,轉載請聲明來源鉆瓜專利網。





