[發明專利]異常醫保單據識別方法、裝置、計算機設備及存儲介質在審
| 申請號: | 202010207827.5 | 申請日: | 2020-03-23 |
| 公開(公告)號: | CN111340638A | 公開(公告)日: | 2020-06-26 |
| 發明(設計)人: | 董奕;吳東輝 | 申請(專利權)人: | 平安醫療健康管理股份有限公司 |
| 主分類號: | G06Q40/08 | 分類號: | G06Q40/08;G06N3/08 |
| 代理公司: | 北京英特普羅知識產權代理有限公司 11015 | 代理人: | 鄧小玲;王勇 |
| 地址: | 200001 上海市黃浦*** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 異常 醫保 單據 識別 方法 裝置 計算機 設備 存儲 介質 | ||
1.一種異常醫保單據識別方法,其特征在于,所述異常醫保單據識別方法包括:
獲取醫保單據數據,并對所述醫保單據數據進行預處理,以得到所述醫保單據數據對應的第一單據項目向量;
將所述第一單據項目向量輸入至預先訓練好的自編碼器中,以通過所述自編碼器輸出重構的第二單據項目向量;
計算所述第一單據項目向量與所述第二單據項目向量的相似度值;及
根據所述相似度值判斷所述醫保單據數據是否為異常醫保單據數據。
2.如權利要求1所述的異常醫保單據識別方法,其特征在于,所述對所述醫保單據數據進行預處理,以得到所述醫保單據數據對應的第一單據項目向量包括:
提取所述醫保單據數據中包含的所有醫療三目錄項目;
對各個醫療三目錄項目進行獨熱編碼,以得到所述醫保單據數據對應的第一單據項目向量。
3.如權利要求1所述的異常醫保單據識別方法,其特征在于,對所述自編碼器進行訓練包括:
獲取訓練樣本集,所述訓練樣本集包括n個正常的醫保單據數據對應的單據項目向量,其中,n為正整數;
構建自編碼器模型,所述自編碼器模型包括編碼器以及解碼器;
采用所述訓練樣本集對所述自編碼器模型進行訓練,其中,在訓練過程中,通過殘差的方式做后向反饋來調整所述自編碼器模型中的各個參數的權重值,直至所述自編碼器模型收斂為止。
4.如權利要求1所述的異常醫保單據識別方法,其特征在于,所述計算所述第一單據項目向量與所述第二單據項目向量的相似度值包括:
計算所述第一單據項目向量與所述第二單據項目向量的余弦相似度。
5.如權利要求1所述的異常醫保單據識別方法,其特征在于,所述計算所述第一單據項目向量與所述第二單據項目向量的相似度值包括:
計算所述第一單據項目向量與所述第二單據項目向量的歐式距離,并將計算得到的歐式距離值作為所述相似度值。
6.如權利要求1至5任一項所述的異常醫保單據識別方法,其特征在于,所述根據所述相似度判斷所述醫保單據數據是否為異常醫保單據數據包括:
計算所述相似度值與第一預設閾值的差的絕對值;
判斷所述絕對值是否大于第二預設閾值,其中,若所述絕對值大于第二預設閾值,則判定所述醫保單據數據為異常醫保單據數據。
7.如權利要求6所述的異常醫保單據識別方法,其特征在于,所述異常醫保單據識別方法還包括:
在判定出所述醫保單據數據為異常醫保單據數據時,對所述醫保單據數據進行標記。
8.一種異常醫保單據識別裝置,其特征在于,包括:
獲取模塊,用于獲取醫保單據數據,并對所述醫保單據數據進行預處理,以得到所述醫保單據數據對應的第一單據項目向量;
輸入模塊,用于將所述第一單據項目向量輸入至預先訓練好的自編碼器中,以通過所述自編碼器輸出重構的第二單據項目向量;
計算模塊,用于計算所述第一單據項目向量與所述第二單據項目向量的相似度值;及
判斷模塊,用于根據所述相似度值判斷所述醫保單據數據是否為異常醫保單據數據。
9.一種計算機設備,包括存儲器、處理器以及存儲在所述存儲器上并可在所述處理器上運行的計算機程序,其特征在于,所述處理器執行所述計算機程序時實現權利要求1至7任一項所述的異常醫保單據識別方法的步驟。
10.一種計算機可讀存儲介質,其特征在于,所述計算機可讀存儲介質內存儲有計算機程序,所述計算機程序可被至少一個處理器所執行,以使所述至少一個處理器執行如權利要求1-7中任一項所述的異常醫保單據識別方法的步驟。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于平安醫療健康管理股份有限公司,未經平安醫療健康管理股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010207827.5/1.html,轉載請聲明來源鉆瓜專利網。





