[發明專利]基于大數據的藥品通用名清洗方法及系統、服務器及介質在審
申請號: | 201911304412.3 | 申請日: | 2019-12-17 |
公開(公告)號: | CN111125076A | 公開(公告)日: | 2020-05-08 |
發明(設計)人: | 黎云;周斌;沈章 | 申請(專利權)人: | 武漢海云健康科技股份有限公司 |
主分類號: | G06F16/215 | 分類號: | G06F16/215;G06F16/23;G06F16/903;G06F16/951 |
代理公司: | 武漢藍寶石專利代理事務所(特殊普通合伙) 42242 | 代理人: | 謝洋 |
地址: | 430000 湖北省武漢市東湖新技術*** | 國省代碼: | 湖北;42 |
權利要求書: | 查看更多 | 說明書: | 查看更多 |
摘要: | |||
搜索關鍵詞: | 基于 數據 藥品 通用 清洗 方法 系統 服務器 介質 | ||
本發明公開了一種基于大數據的藥品通用名清洗方法及系統、服務器及介質,該方法包括構建標準通用名數據庫:利用網絡爬蟲技術爬取藥品的通用名數據,獲取已清洗過的藥品的通用名數據,將通用名數據合并排重、清洗以獲得標準通用名數據,導入標準通用名數據庫;對每一個新增的藥企數據進行通用名清洗:將藥企新增的通用名與標準通用名數據進行匹配,若滿足匹配要求則入相應的數據庫,并更新標準通用名數據庫。本發明通過構建標準通用名數據庫,并將藥企新增的通用名與標準通用名數據庫中的標準通用名數據進行匹配,以實現自動化的對每一個新增的藥企數據中的通用名進行清洗,其在保證準確率的基礎上,減少了人力投入,降低了藥品通用名清洗成本。
技術領域
本發明涉及醫療大數據技術領域,尤其涉及一種基于大數據的藥品通用名清洗方法及系統、服務器及介質。
背景技術
如今不同藥企的藥品通用名由于地域性、習慣性差異,往往同種藥品的名稱不盡相同,想要跨藥店分析藥品的銷售情況,對會員購藥行為分析十分困難,對產品進行決策產生了巨大的阻礙。
目前通用做法是停留在投入大量人力方法上,將各個藥店的藥品名稱進行綜合排重,然后交給運營部門按照64大分類進行藥品通用名的一一核實,對于名稱產生歧義的,需要借助其藥性、成分、廠家對比,同時借助百度百科相關資料,以及向專業的藥師進行一一咨詢,造成極大的人力物力時間成本浪費,無法達到藥店合并帶來的新增藥品的數據清洗需求
發明內容
有鑒于此,本發明實施例提供了一種基于大數據的藥品通用名清洗方法及系統、服務器及介質,以能夠自動實現新增的藥企新數據分析。
本發明實施例的第一方面,提供了一種基于大數據的藥品通用名清洗方法,包括如下步驟:
構建標準通用名數據庫:利用網絡爬蟲技術爬取藥品的通用名數據,并獲取已清洗過的藥品的通用名數據,將爬取的藥品的通用名數據與已清洗過的藥品的通用名數據合并排重、清洗以獲得標準通用名數據,并將標準通用名數據導入標準通用名數據庫;
對每一個新增的藥企數據進行通用名清洗:將藥企新增的通用名與標準通用名數據庫中的標準通用名數據進行匹配,若滿足匹配要求則入相應的數據庫,并更新標準通用名數據庫。
本發明實施例的第二方面,提供了一種基于大數據的藥品通用名清洗系統,包括:
標準通用名數據庫構建模塊,其用于利用網絡爬蟲技術爬取藥品的通用名數據,并獲取已清洗過的藥品的通用名數據,將爬取的藥品的通用名數據與已清洗過的藥品的通用名數據合并排重、清洗以獲得標準通用名數據,并將標準通用名數據導入標準通用名數據庫;
通用名清洗模塊,其用于將藥企新增的通用名與標準通用名數據庫中的標準通用名數據進行匹配,若滿足匹配要求則入相應的數據庫,并更新標準通用名數據庫。
本發明實施例的第三方面,提供了一種服務器,包括存儲器、處理器以及存儲在所述存儲器中并可在所述處理器上運行的計算機程序,所述處理器執行所述計算機程序時實現如上所述基于大數據的藥品通用名清洗方法的步驟。
本發明實施例的第四方面,提供了一種計算機可讀存儲介質,所述計算機可讀存儲介質存儲有計算機程序,所述計算機程序被處理器執行時實現如上所述基于大數據的藥品通用名清洗方法的步驟。
本發明提供的基于大數據的藥品通用名清洗方法及系統、服務器及介質,其通過構建標準通用名數據庫,并將藥企新增的通用名與標準通用名數據庫中的標準通用名數據進行匹配,以實現自動化的對每一個新增的藥企數據中的通用名進行清洗,其在保證準確率的基礎上,減少了人力投入,降低了藥品通用名清洗成本。
附圖說明
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于武漢海云健康科技股份有限公司,未經武漢海云健康科技股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201911304412.3/2.html,轉載請聲明來源鉆瓜專利網。
- 數據顯示系統、數據中繼設備、數據中繼方法、數據系統、接收設備和數據讀取方法
- 數據記錄方法、數據記錄裝置、數據記錄媒體、數據重播方法和數據重播裝置
- 數據發送方法、數據發送系統、數據發送裝置以及數據結構
- 數據顯示系統、數據中繼設備、數據中繼方法及數據系統
- 數據嵌入裝置、數據嵌入方法、數據提取裝置及數據提取方法
- 數據管理裝置、數據編輯裝置、數據閱覽裝置、數據管理方法、數據編輯方法以及數據閱覽方法
- 數據發送和數據接收設備、數據發送和數據接收方法
- 數據發送裝置、數據接收裝置、數據收發系統、數據發送方法、數據接收方法和數據收發方法
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置