[發明專利]基于概念泛化的藥品類風險特征挖掘的方法在審
| 申請號: | 202010190533.6 | 申請日: | 2020-03-18 |
| 公開(公告)號: | CN111415757A | 公開(公告)日: | 2020-07-14 |
| 發明(設計)人: | 王晶;盧志強;魏建香 | 申請(專利權)人: | 南京郵電大學 |
| 主分類號: | G16H70/40 | 分類號: | G16H70/40 |
| 代理公司: | 南京蘇科專利代理有限責任公司 32102 | 代理人: | 陳棟智 |
| 地址: | 210003 江蘇*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 概念 泛化 藥品 風險 特征 挖掘 方法 | ||
本發明提出了一種基于概念泛化的藥品類風險特征挖掘的方法,包括以下步驟:數據處理;藥品的概念泛化與統計;概念泛化后的數據組織:將原始ADR數據按照“藥品類?不良反應”組合重新組織并計算各組合的頻次;步驟4)信號檢測:運用信號檢測的
技術領域
本發明涉及一種數據挖掘方法,具體的說是一種基于概念泛化的藥品類風險特征挖掘的方法,屬于數據挖掘技術領域。
背景技術
藥品不良反應信號檢測是目前國際上對上市后藥品安全進行藥物警戒的基本手段。主流的方法包括PRR、MHRA、IC、ROR等比例失衡分析技術,取得了較好的研究成果,但這些方法主要用于“藥品-不良反應”組合這類信號的檢測,對藥品類與不良反應累及系統器官之間關聯信號的檢測方法研究缺乏。本發明主要采用概念泛化的分層歸納技術,并且引入IC信號檢測的方法,對藥品類引起的不良反應進行針對性的泛化,泛化后對不同概念的數據進行分層處理,尋找數據依賴關系,使其分類比較合理,便于更好地與系統器官關聯。
發明內容
本發明的目的是提供一種基于概念泛化的藥品類風險特征挖掘的方法,突破了現有的“藥品-不良反應”信號挖掘的研究,基于我國ADR監測報告數據,利用概念泛化和特征提取方法挖掘“藥品類-累及系統器官”信號。
本發明的目的是這樣實現的:一種基于概念泛化的藥品類風險特征挖掘的方法,包括以下步驟:
步驟1)數據處理:以我國藥品不良反應監測數據為原始ADR數據,按照“藥品-不良反應”組合進行匯總統計,標記總樣本;
步驟2)藥品的概念泛化與統計:按照我國《藥品目錄》中的分類標準并結合《中國藥典》的藥物信息,將總樣本中的藥品通用名泛化成所屬的藥品類,并統計出各藥品類引起的各個不良反應頻次;
步驟3)概念泛化后的數據組織:將原始ADR數據按照“藥品類-不良反應”組合重新組織并計算各組合的頻次a,并基于頻次a,分別計算b,c,d,構建各個組合的四格表:目標藥物類與目標不良反應之間的頻次為a、目標藥物類與其他不良反應之間的頻次為b、非目標藥物類與目標不良反應之間的頻次為c、非目標藥物類與其他不良反應之間的頻次為d,為檢測“藥品類-不良反應”關聯信號挖掘奠定基礎;
步驟4)信號檢測:運用信號檢測的IC方法對所述樣本“目標藥物類-目標不良反應”進行信號檢測,求出所有“藥品類-不良反應”之間的IC值;
步驟5)不良反應的概念泛化:對IC0的“藥品類-不良反應”陽性組合信號,將其“不良反應”按照WHO-ART中的分類標準泛化為對應的累及系統器官損害,并將數據組織成藥品類、不良反應和累及系統器官損害;
步驟6)特征提取:對上述步驟4)中求得的IC值按降序排列,并利用DCG(Discounted Cumulative Gain)特征提取方法,計算藥品類引起的每個累及系統器官損害的得分,以DCG得分來衡量“藥品類”與“累及系統器官”之間的關聯風險程度;
步驟7)結果驗證:利用美國FDA和我國CFDA信息通報的數據對所述方法的結果進行驗證。
作為本發明的進一步限定,步驟1)具體包括:
1.1)獲取原始ADR數據庫,本研究中所有ADR數據均來自于我國藥品不良反應監測數據庫;選取了江蘇省藥品不良反應報告數據;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于南京郵電大學,未經南京郵電大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010190533.6/2.html,轉載請聲明來源鉆瓜專利網。





