[發明專利]醫保數據處理方法、裝置、計算機設備和存儲介質有效
| 申請號: | 202010037445.2 | 申請日: | 2020-01-14 |
| 公開(公告)號: | CN111259089B | 公開(公告)日: | 2023-03-21 |
| 發明(設計)人: | 張旭 | 申請(專利權)人: | 平安醫療健康管理股份有限公司 |
| 主分類號: | G06F16/28 | 分類號: | G06F16/28;G06F16/215;G06Q40/08 |
| 代理公司: | 華進聯合專利商標代理有限公司 44224 | 代理人: | 姜曉云 |
| 地址: | 200001 上海市黃浦*** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 醫保 數據處理 方法 裝置 計算機 設備 存儲 介質 | ||
本申請涉及大數據領域,具體涉及一種醫保數據處理方法、裝置、計算機設備和存儲介質。所述方法包括:接收醫保終端發送的預設周期內的醫保結算數據;根據醫保結算數據的數據內存以及實時獲取的運算內存確定運算數據量;根據參保標識和購藥信息生成數據透視表,根據運算數據量按照預設順序從數據透視表中提取參保標識的透視參數,構建透視矩陣;采用矩陣乘法對透視矩陣進行處理得到共現矩陣,共現矩陣用于表示預設順序的參保標識與所有參保標識的相遇次數;根據相遇次數對參保標識進行篩選得到違規集合,并將違規集合的參保標識發送給醫保終端。采用本方法能夠對大批量醫保結算數據順利進行排查,降低系統崩潰的概率。
技術領域
本申請涉及數據清洗技術領域,特別是涉及一種醫保數據處理方法、裝置、計算機設備和存儲介質。
背景技術
通過醫療保險,參保人員可以以低廉的價格購買各種醫保藥品。出于利益,醫藥販子會與參保人合作,提前收集一批參保人的醫???,利用醫??ㄅ蔚蛢r購藥,這種行為損害了其他參保人的醫保利益,需要及時進行標識,再將被標識的異常數據從大量的醫保結算數據中排除。但是,當醫保結算數據對應的參保人數量以萬為單位時,對應的醫保結算數據量成幾何增加,有時可以達到數G,超出了計算機系統的運行內存。因而,如何在保證計算機運行的情況下,對大批量醫保結算數據順利進行排查,降低系統崩潰的概率是醫保數據處理的難點。
發明內容
基于此,有必要針對上述技術問題,提供一種能夠對大批量醫保結算數據順利進行排查,降低系統崩潰的概率的醫保數據處理方法、裝置、計算機設備和存儲介質。
一種醫保數據處理方法,所述方法包括:
接收醫保終端發送的預設周期內的醫保結算數據,所述醫保結算數據攜帶有參保標識和購藥信息;
根據所述醫保結算數據的數據內存以及實時獲取的運算內存確定運算數據量;
根據所述參保標識和所述購藥信息生成數據透視表,并根據所述運算數據量按照預設順序從所述數據透視表中提取所述參保標識的透視參數,構建與所述參保標識對應的透視矩陣;
采用矩陣乘法對所述透視矩陣進行處理得到共現矩陣,所述共現矩陣用于表示預設順序的參保標識與所有參保標識的相遇次數;
根據所述相遇次數對所述參保標識進行篩選得到違規集合,所述違規集合的所述參保標識對應的相遇次數大于預設閾值,并將所述違規集合中的參保標識發送給所述醫保終端。
在其中一個實施例中,所述根據所述參保標識和所述購藥信息生成數據透視表,包括:
對所述醫保結算數據進行解析抽取,得到結算明細表;
排查所述結算明細表中的異常值,并對應刪除所述結算明細表中的異常值;
確定所述結算明細表中與缺失值所在變量最相關的醫保結算數據參數,并將所述醫保結算數據參數代入缺失值所在變量,得到清洗后的醫保結算數據;
采用預設統計規則對清洗后的所述醫保結算數據進行統計,得到數據透視表。
在其中一個實施例中,所述根據所述醫保結算數據的數據內存以及實時獲取的運算內存確定運算數據量,包括:
實時獲取運算內存,并根據所述運算內存獲取與矩陣計算相關的矩陣運算速度;
獲取與所述數據內存對應的運算時間;
根據所述矩陣運算速度和所述運算時間確定運算數據量。
在其中一個實施例中,所述采用矩陣乘法對所述透視矩陣進行處理得到共現矩陣,包括:
從所述數據透視表中提取與所述參保標識對應的透視參數,并根據所述透視參數構建參考矩陣;
計算所述透視矩陣對應的轉置矩陣;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于平安醫療健康管理股份有限公司,未經平安醫療健康管理股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010037445.2/2.html,轉載請聲明來源鉆瓜專利網。





