[發明專利]上市藥品信息標準化方法、設備、服務器及存儲介質在審
| 申請號: | 202010002703.3 | 申請日: | 2020-01-02 |
| 公開(公告)號: | CN111180087A | 公開(公告)日: | 2020-05-19 |
| 發明(設計)人: | 朱彥;劉麗紅;賈李蓉;劉靜;高博;陳超;聶瑩;喬幸潮 | 申請(專利權)人: | 中國中醫科學院中醫藥信息研究所 |
| 主分類號: | G16H70/40 | 分類號: | G16H70/40;G06F40/289 |
| 代理公司: | 北京北匯律師事務所 11711 | 代理人: | 李英杰 |
| 地址: | 100700 北*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 上市 藥品信息 標準化 方法 設備 服務器 存儲 介質 | ||
1.一種對上市藥品信息進行標準化的方法,其特征在于,包括:
從藥品標準中采集藥品標準數據;
對所采集的藥品標準數據進行結構化處理來形成經結構化處理的藥品標準數據;
采集藥品數據,所述藥品數據包括藥品名稱和批準文號;
將所采集的藥品數據在經結構化處理的藥品標準數據中進行匹配;以及
在成功匹配的情況下,在網絡上自動檢索與所述藥品數據相對應的藥品說明書,并且將所采集的藥品數據和所采集的藥品說明書相關聯地存儲在經結構化處理的藥品信息數據庫中的對應條目中。
2.根據權利要求1所述的方法,其特征在于,所述對所采集的藥品標準數據進行結構化處理來形成經結構化處理的藥品標準數據進一步包括:
對采集的藥品標準數據的粗文本進行校對,得到標準數據的精校文本;以及
從精校文本中提取與以下各項中的一項或多項字段相對應的信息,形成經結構化處理的藥品標準數據:正式名稱、別名、拼音名、英文名、藥品類型標識、標準來源書籍、標準編號、處方、制法、性狀、鑒別、檢查、功能與主治、類別、用法與用量、規格、貯藏方法,
其中所述提取使用正則表達式方法。
3.根據權利要求2所述的方法,其特征在于,所述對所采集的藥品標準數據進行結構化處理來形成經結構化處理的藥品標準數據進一步包括:
整理采集到的藥品標準數據,其中如果采集到的藥品標準數據是圖像格式,則對圖像格式的藥品標準數據進行OCR自動識別,得到藥品標準數據的文本格式的粗文本。
4.根據權利要求2所述的方法,其特征在于,所述藥品標準數據的精校文本的處方字段對應的信息是一段自由文本,所述對所采集的藥品標準數據進行結構化處理來形成經結構化處理的藥品標準數據進一步包括:
將所述自由文本中的物質、劑量和單位抽取出來,并利用物質術語表、劑量術語表和單位術語表來進行標準化,具體包括:
準備物質表、劑量表和單位表;以及
對所述自由文本進行中文分詞,識別出多個“物質-劑量-劑量單位”單元。
5.根據權利要求1-4中任一項所述的方法,其特征在于,還包括:
在未能成功匹配的情況下,更新所述經結構化處理的藥品標準數據;和/或,
所述將所采集的藥品數據和所采集的藥品說明書相關聯地存儲在經結構化處理的藥品信息數據庫中的對應條目中進一步包括:將所采集的藥品說明書和經結構化處理的藥品信息數據庫中的對應條目這二者中預設字段所對應的信息進行再次匹配,只有所述在此匹配成功的情況下,才將將所采集的藥品數據和所采集的藥品說明書相關聯地存儲在經結構化處理的藥品信息數據庫中的對應條目中,否則,更新所述經結構化處理的藥品標準數據。
6.一種對上市藥品信息進行標準化的設備,其特征在于,包括:
藥品標準數據采集裝置,用于從藥品標準中采集藥品標準數據;
結構化處理裝置,用于對所采集的藥品標準數據進行結構化處理來形成經結構化處理的藥品標準數據;
藥品數據采集裝置,用于采集藥品數據,所述藥品數據包括藥品名稱和批準文號;
匹配裝置,用于將所采集的藥品數據在經結構化處理的藥品標準數據中進行匹配;以及
藥品說明書檢索裝置,用于在成功匹配的情況下,在網絡上自動檢索與所述藥品數據相對應的藥品說明書,并且將所采集的藥品數據和所采集的藥品說明書相關聯地存儲在經結構化處理的藥品信息數據庫中的對應條目中。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國中醫科學院中醫藥信息研究所,未經中國中醫科學院中醫藥信息研究所許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010002703.3/1.html,轉載請聲明來源鉆瓜專利網。





