[發明專利]異常醫保單據識別方法、裝置、計算機設備及存儲介質在審
| 申請號: | 202010207827.5 | 申請日: | 2020-03-23 |
| 公開(公告)號: | CN111340638A | 公開(公告)日: | 2020-06-26 |
| 發明(設計)人: | 董奕;吳東輝 | 申請(專利權)人: | 平安醫療健康管理股份有限公司 |
| 主分類號: | G06Q40/08 | 分類號: | G06Q40/08;G06N3/08 |
| 代理公司: | 北京英特普羅知識產權代理有限公司 11015 | 代理人: | 鄧小玲;王勇 |
| 地址: | 200001 上海市黃浦*** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 異常 醫保 單據 識別 方法 裝置 計算機 設備 存儲 介質 | ||
本發明實施例提供了一種異常醫保單據識別方法,包括:獲取醫保單據數據,并對所述醫保單據數據進行預處理,以得到所述醫保單據數據對應的第一單據項目向量;將所述第一單據項目向量輸入至預先訓練好的自編碼器中,以通過所述自編碼器輸出重構的第二單據項目向量;計算所述第一單據項目向量與所述第二單據項目向量的相似度值;及根據所述相似度值判斷所述醫保單據數據是否為異常醫保單據數據。本發明實施例可以提高對異常醫保單據識別的準確度。
技術領域
本發明實施例涉及數據處理技術領域,尤其涉及一種異常醫保單據識別、裝置、計算機設備及存儲介質。
背景技術
目前,醫療保險已成為許多國家的主要支出,然而,在這些支出中存在一部分因醫療欺詐行為而產生。醫保欺詐行為的發生對我國醫保基金造成巨大沖擊,每年將造成百億元的經濟損失。目前比較常見的醫保欺詐行為有異常單據報銷,其中,異常單據報銷具體表現為醫生治療參保人的病時,實際使用了三目錄項目A、三目錄項目B、三目錄項目C來治療參保人,然而,醫院在對該參保人的醫保單據進行報銷時,在該醫保單據除了填入三目錄項目A、三目錄項目B、三目錄項目C之外,可能還填入了三目錄項目D,或者三目錄項目A修改為三目錄項目D等,在醫上申報的醫保單據與真實的醫保單據不同。
現有在對異常單據進行識別時,主要是基于預先制定的規則進行篩選,然而,這種規則的生成強烈依賴業務經驗的輸入,比較難以保證對單病種欺詐行為識別的準確度。
發明內容
有鑒于此,本發明實施例的目的是提供一種異常醫保單據識別方法、裝置、計算機設備及計算機可讀存儲介質,用于解決現有對異常醫保單據進行識別時,準確度較低的問題。
為實現上述目的,本發明實施例提供了一種異常醫保單據識別方法,包括:
獲取醫保單據數據,并對所述醫保單據數據進行預處理,以得到所述醫保單據數據對應的第一單據項目向量;
將所述第一單據項目向量輸入至預先訓練好的自編碼器中,以通過所述自編碼器輸出重構的第二單據項目向量;
計算所述第一單據項目向量與所述第二單據項目向量的相似度值;及
根據所述相似度值判斷所述醫保單據數據是否為異常醫保單據數據。
可選地,所述對所述醫保單據數據進行預處理,以得到所述醫保單據數據對應的第一單據項目向量包括:
提取所述醫保單據數據中包含的所有醫療三目錄項目;
對各個醫療三目錄項目進行獨熱編碼,以得到所述醫保單據數據對應的第一單據項目向量。
可選地,對所述自編碼器進行訓練包括:
獲取訓練樣本集,所述訓練樣本集包括n個正常的醫保單據數據對應的單據項目向量,其中,n為正整數;
構建自編碼器模型,所述自編碼器模型包括編碼器以及解碼器;
采用所述訓練樣本集對所述自編碼器模型進行訓練,其中,在訓練過程中,通過殘差的方式做后向反饋來調整所述自編碼器模型中的各個參數的權重值,直至所述自編碼器模型收斂為止。
可選地,所述計算所述第一單據項目向量與所述第二單據項目向量的相似度值包括:
計算所述第一單據項目向量與所述第二單據項目向量的余弦相似度。
可選地,,所述計算所述第一單據項目向量與所述第二單據項目向量的相似度值包括:
計算所述第一單據項目向量與所述第二單據項目向量的歐式距離,并將計算得到的歐式距離值作為所述相似度值。
可選地,所述根據所述相似度判斷所述醫保單據數據是否為異常醫保單據數據包括:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于平安醫療健康管理股份有限公司,未經平安醫療健康管理股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010207827.5/2.html,轉載請聲明來源鉆瓜專利網。





