[發明專利]一種基于社交媒體數據分析的藥物潛在副作用挖掘方法在審
| 申請號: | 202110596995.2 | 申請日: | 2021-05-31 |
| 公開(公告)號: | CN113033210A | 公開(公告)日: | 2021-06-25 |
| 發明(設計)人: | 湯步洲;陳帥;熊英;陳清財 | 申請(專利權)人: | 哈爾濱工業大學(深圳)(哈爾濱工業大學深圳科技創新研究院) |
| 主分類號: | G06F40/295 | 分類號: | G06F40/295;G06F40/242;G06F40/216;G06K9/62;G16H70/40 |
| 代理公司: | 深圳市君勝知識產權代理事務所(普通合伙) 44268 | 代理人: | 朱陽波 |
| 地址: | 518000 廣東省深圳市南*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 社交 媒體 數據 分析 藥物 潛在 副作用 挖掘 方法 | ||
本發明公開了一種基于社交媒體數據分析的藥物潛在副作用挖掘方法,所述方法包括:獲取社交媒體的藥物評論數據并對所述藥物評論數據進行數據預處理,得到藥物評論預處理數據,再基于經過訓練的BERT語言模型識別所述藥物評論預處理數據的藥物副作用實體;基于排序的實體標準化方式將所述藥物副作用實體映射到標準副作用概念詞典,得到初始藥物副作用概念;根據所述初始藥物副作用概念和官方報告藥物副作用概念,得到潛在藥物副作用概念。本發明實施例通過上述方法通過對廣大民眾最真實的用藥體驗進行分析,可以得到藥物更加全面的潛在副作用信息。
技術領域
本發明涉及人工智能技術領域,尤其涉及的是一種基于社交媒體數據分析的藥物潛在副作用挖掘方法。
背景技術
藥物安全是病人健康安全的基本組成部分,長期受到醫學界和民眾的廣泛關注。所謂藥物副作用(Adverse Drug Reaction,ADR)是指患者服用正常劑量的藥物治療疾病時,觀察到的超出預期之外的對患者身體有害的反應。藥物副作用涉及的領域非常廣泛,包括藥物服用成癮、患者出現耐藥性、患者服用藥物后出現了非預期的過敏反應和因服用藥物導致患者原有的病情加重等情況。一般認為所有藥物都有副作用,有些副作用可能具有致命性。
對于藥物副作用的及早發現通常有兩種渠道,一種是新藥上市前制藥公司開展的臨床試驗;第二種是上市后制藥公司通過類似疾病預防控制中心的國家衛生系統收集相關藥物副作用信息。但根據實際情況來看,僅通過臨床試驗和官方藥物副作用反饋平臺來收集與發現藥物副作用是遠遠不夠的。一方面,對于制藥公司開展的臨床試驗,由于藥物內部構成復雜,患者群體多樣性,很難在這個階段檢測到所有可能的副作用。另一方面,新藥物上市后,由于官方反饋平臺往往效率低,因此很難及時的將搜集到的藥物副作用相關信息反饋到對應機構。此外,臨床醫療數據涉及到大量隱私信息,獲取難度大。
隨著Web 2.0技術的發展,社交媒體(如社區、論壇、博客、Wiki等)逐漸在人群中流行,大量互聯網用戶在社交媒體上的交流產生了大量用戶生成內容(User-GeneratedContent,UGC),這些內容極大地豐富了網絡世界,這其中就包括部分患者對藥物的評論信息。最近幾年,隨著互聯網用戶對于藥物信息獲取的需求逐漸增大,大量的醫療健康類社交網站相繼出現,如DailyStrength、AskaPatient、百度病友吧、丁香園等。這些網站聚集了大量的相關人員,在這類網站上他們以發帖或者評論的形式對一些藥物發表用藥體驗,這些社交媒體數據是藥物在患者群體的真實寫照,對于藥物副作用的研究具有重大價值。因此如何從這些醫療健康類社交媒體網站中挖掘藥物的潛在副作用信息,逐漸成為藥物警戒研究的重要方向之一,越來越受到研究人員的重視。
因此,現有技術還有待改進和發展。
發明內容
本發明要解決的技術問題在于,針對現有技術的上述缺陷,提供一種基于社交媒體數據分析的藥物潛在副作用挖掘方法,旨在解決現有技術中存在兩方面問題:一方面,對于制藥公司開展的臨床試驗,由于藥物內部構成復雜,患者群體多樣性,很難在這個階段檢測到所有可能的副作用。另一方面,新藥物上市后,由于官方反饋平臺往往效率低,因此,很難及時的將搜集到的藥物副作用相關信息反饋到對應機構的問題。
本發明解決問題所采用的技術方案如下:
第一方面,本發明實施例提供一種基于社交媒體數據分析的藥物潛在副作用挖掘方法,其中,所述方法包括:
獲取社交媒體的藥物評論數據并對所述藥物評論數據進行數據預處理,得到藥物評論預處理數據,再基于經過訓練的BERT語言模型識別所述藥物評論預處理數據的藥物副作用實體;其中,所述藥物副作用實體用于表征藥物副作用的實際描述;
基于排序的實體標準化方式將所述藥物副作用實體映射到標準副作用概念詞典,得到初始藥物副作用概念;所述標準副作用概念詞典為所述藥物副作用實體與所述初始藥物副作用概念的映射關系;所述初始藥物副作用概念用于表征藥物副作用的名詞;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于哈爾濱工業大學(深圳)(哈爾濱工業大學深圳科技創新研究院),未經哈爾濱工業大學(深圳)(哈爾濱工業大學深圳科技創新研究院)許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110596995.2/2.html,轉載請聲明來源鉆瓜專利網。
- 數據顯示系統、數據中繼設備、數據中繼方法、數據系統、接收設備和數據讀取方法
- 數據記錄方法、數據記錄裝置、數據記錄媒體、數據重播方法和數據重播裝置
- 數據發送方法、數據發送系統、數據發送裝置以及數據結構
- 數據顯示系統、數據中繼設備、數據中繼方法及數據系統
- 數據嵌入裝置、數據嵌入方法、數據提取裝置及數據提取方法
- 數據管理裝置、數據編輯裝置、數據閱覽裝置、數據管理方法、數據編輯方法以及數據閱覽方法
- 數據發送和數據接收設備、數據發送和數據接收方法
- 數據發送裝置、數據接收裝置、數據收發系統、數據發送方法、數據接收方法和數據收發方法
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置





