[發明專利]一種從社交媒體中自動發掘不良藥物反應的方法在審
| 申請號: | 202110317630.1 | 申請日: | 2021-03-25 |
| 公開(公告)號: | CN113158073A | 公開(公告)日: | 2021-07-23 |
| 發明(設計)人: | 韋嘉;葉翔赟 | 申請(專利權)人: | 上海基緒康生物科技有限公司 |
| 主分類號: | G06F16/9536 | 分類號: | G06F16/9536;G16H70/40;G16H50/70 |
| 代理公司: | 武漢智新達知識產權代理事務所(特殊普通合伙) 42272 | 代理人: | 李丹萍 |
| 地址: | 200000 上海市浦東新區*** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 社交 媒體 自動 發掘 不良 藥物 反應 方法 | ||
本發明涉及藥物信息發掘應用技術領域,且公開了一種從社交媒體中自動發掘不良藥物反應的方法。該從社交媒體中自動發掘不良藥物反應的方法,使用一種半監督的機器學習框架,從自然語言文本中提取句法特征,以識別藥物和與之正相關的不良反應,其關鍵貢獻在于引入了一種幾乎不需要手動注釋的自動標簽生成算法,因此該方法也具有更廣的適應性。通過手動標記的測試集與其它可選方法的分類檢測效果相比較,該方法在保證精確度的同時具有更好的穩定性,此外,該方法側重于在中文信息中檢索不良藥物反應信息,既可以檢測已知不良反應在特定人群中的發生頻率又可以發掘未知的不良反應信息,從而在深度和廣度上擴大對不良藥物反應的認知。
技術領域
本發明涉及藥物信息發掘應用技術領域,具體為一種從社交媒體中自動 發掘不良藥物反應的方法。
背景技術
明確不良藥物反應(ADR,Adverse Drug Reaction)是藥物研發的一個 重點,但上市前的臨床實驗往往會受到受試者人數,研究時間和制藥公司以 及患者經濟壓力等的限制,近年來的一些研究也試圖用藥物的化學結構、靶 點蛋白或者藥物研發周期中的治療指征等,對藥物的不良反應進行預測,然 而,某些藥物的新不良反應只有在上市后,在不同的人種中或伴有不同疾病 的人群中被廣泛使用后,才會被認知,又或者某些不良反應要經過一段較長 時間的積累才會顯現,而這個時間跨度甚至可能超出該藥物的研發周期,為 避免事故的發生,藥品監管部門和制藥公司都不惜付出巨大努力和代價去進 行上市后的四期臨床實驗以計算機為基礎在現有的數據資源中發掘不良藥物 反應的研究,也成為對昂貴的四期臨床實驗的一種有效的補充。
近年來,越來越多的研究旨在從各種數據資源中發掘藥物的不良反應, 隨著數據資源的不同(可以是結構化也可以是非結構化的文本),使用的挖掘 方法也不同,結構化資源主要指衛生部門(比如FDA)收集的正式的不良事件 報告,這些報告由于嚴格遵守不良事件報告標準,因此相對易于處理,但是, 提交報告的程序相對復雜,而且大部分患者不了解自發報告系統,因此此類 報告的數量非常有限,而非結構化的數據資源包括生物醫學文獻,臨床記錄 或病歷以及線上的健康討論等,但對這些數據資源的處理存在較大的挑戰,因為有用的信息被嵌在了自然語言里,被賦予了固有的模棱兩可性和嘈雜性, 其中,生物醫學文獻還是相對較好挖掘的,因為藥物和不良反應都會以各自 正規的名字被提及,但這些信息不會實時更新甚至有時還會產生偏差,用各 種文本挖掘的方法也能從臨床記錄和病歷提取相應的不良藥物反應信息,但 考慮到病人隱私以及訪問限制等問題,這樣的數據來源也是十分有限的,所 以,相對而言,線上的社交媒體,特別是一些健康論壇,能為藥物的使用情 況提供最為全面和及時的信息,但同時想從這些信息中發掘不良藥物反應, 會遇到很多挑戰,主要包括大量口語的使用,拼寫和語法錯誤等。
現有的從社交媒體中進行文本挖掘的方法可以歸納為如下幾種:基于詞 匯的方法、統計學方法、基于規則的方法、高級自然語言處理(NLP)方法以 及神經網絡,之前大多數方法都側重于擴充詞匯庫以求在文本中找到對應不 良反應相關描述,這些基于詞匯庫的方法,可能由于對不良反應描述的新的 網絡用語不斷出現,而無法識別詞匯庫中未包含的非常規不良反應,此外, 它們還會因為詞語拼寫錯誤而導致近似字符串匹配不佳,于是一些研究人員 開始另辟蹊徑,他們利用統計學方法或者基于規則(或模式)的方法又或者借助支持向量機(SVM)和條件隨機場(CRF)等高級自然語言處理方法,尋 求從社交媒體中發掘ADR的更佳方案,這些方法雖然都可以到達合理的準確 性,但它們的構建都需要監督訓練,在機器學習過程中還要用到大量數據, 這些都是需要耗費大量人力操作的,此外,研究者們還嘗試過用各種結構的 神經網絡來檢測社交媒體中的ADR,比如,卷積神經網絡,遞歸神經網絡以及 它們的組合等,甚至注意力機制和條件隨機場有時也會被加入到神經網絡結 構中以提高其系統性能,另外,即使之前已經有很多研究關于如何從英文的 網上論壇中發掘未知的不良反應,但對中文論壇發掘的研究卻鮮有,故而提 出一種從中文社交媒體中自動發掘不良藥物反應的方法,并且來解決上述其 他方案中遇到的問題。
發明內容
(一)解決的技術問題
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于上海基緒康生物科技有限公司,未經上海基緒康生物科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110317630.1/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:可生化降解固體廢棄物的處理方法
- 下一篇:一種大型抗風廣告牌





