[發明專利]一種醫療保險異常數據在線智能檢測方法在審
| 申請號: | 201510760477.4 | 申請日: | 2015-11-10 |
| 公開(公告)號: | CN105279382A | 公開(公告)日: | 2016-01-27 |
| 發明(設計)人: | 付波;李民強;沈磊;張巖龍;鄧軍 | 申請(專利權)人: | 成都數聯易康科技有限公司 |
| 主分類號: | G06F19/00 | 分類號: | G06F19/00;G06F17/30;G06K9/62 |
| 代理公司: | 成都金英專利代理事務所(普通合伙) 51218 | 代理人: | 袁英 |
| 地址: | 611730 四川省*** | 國省代碼: | 四川;51 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 醫療保險 異常 數據 在線 智能 檢測 方法 | ||
技術領域
本發明涉及一種醫療保險異常數據在線智能檢測方法。
背景技術
隨著社會經濟的發展,國家為了給老百姓提供更好的醫保環境,醫保政策越來越好。然而,總有一些人通過各種各樣的手段來騙取醫保。
當前的醫療保險,行業整體業務經營與管理比較粗放,缺乏風險把控;粗放的理賠服務和條款賠付,缺乏對疾病治療的深度分析、醫療費用的風險把控、醫療服務的合理性判斷,導致大量欺詐、不合理醫療,嚴重損害了其他真正需要醫保救治人的權益,給危害了國家醫療保險制度。
對于這種問題,一般可以通過分析醫保人員的就醫數據,從而幫助社保機構檢測出異常數據;然而,面對醫院每天產生的原始醫保數據,如果僅通過人工手段來進行異常檢測的話,不僅速度慢,浪費人力,且難保證準確度,再加上醫院每天的數據都是動態增加,加大了人工處理的難度;因此,目前采用數據挖掘技術是發現醫保異常數據的重要智能化手段。
數據挖掘技術是發現數據潛在信息、揭示隱藏模型、預測發展趨勢的重要技術手段;在金融、電信、商業和保險等行業廣泛應用并取得成功;國內外醫療保險行業,常涉及定向營銷策略制定、客戶忠誠度分析、保險產品交叉銷售等;IBM研究中心的Marisa等人基于澳大利亞醫療機構,采用關聯規則和神經分割技術,從GB級的數據中獲取未知模式;MohitKumar等使用數據挖掘和機器學習技術,預測和預防保險公司在處理醫療保險申述過程中的支付錯誤、異常和欺詐檢測;國內研究主要集中在基金風險和控制醫療費用增長上,采用簡單規則的數據篩選方法,缺乏全面而強有力的大數據分析支持。
發明內容
本發明的目的在于克服現有技術的不足,提供一種醫療保險異常數據在線智能檢測方法,首先對原始醫保數據進行篩選,得到可疑特征數據簇,再對可疑特征數據簇中的數據進行人工審核標注,利用標注后的數據進行模型訓練,將訓練成熟后的模型用于醫保數據的在線自動檢測,大大減少人工檢測的勞動成本,同時可有效提高異常醫保數據檢測的準確率,從而能夠使得醫保基金使用更加合理應用到老百姓的就醫中,防止了醫保欺詐行為。
本發明的目的是通過以下技術方案來實現的:一種醫療保險異常數據在線智能檢測方法,包括以下步驟:
S1.訓練數據集獲取:提取原始醫保數據并進行聚類和篩選得到可疑特征數據簇,對篩選出來的可疑特征數據簇中的數據進行人工審核和標注,并將標注后的數據加入待訓練數據集;
S2.在線學習:訓練模型利用標注后的可疑特征數據簇進行在線訓練學習,直到訓練模型的成熟度滿足要求后,定義訓練模型訓練成熟,存儲訓練成熟的模型參數;
S3.在線檢測:讀取成熟的模型參數初始化相應模型,來對輸入的醫保數據進行在線檢測和標記,根據標記結果判斷醫保數據是異常,將異常數據保存到異常數據庫中。
所述的一種醫療保險異常數據在線智能檢測方法,還包括一個檢測修正步驟S4,包括以下子步驟:
S41.醫保業務系統在使用檢測后的醫保數據時,發現數據檢測結果與具體業務有差異,則調整檢測標記值,并將有差異的數據存儲到反饋數據庫中;
S42.從反饋數據庫提取數據,跳轉至步驟S2,重新利用這部分數據進行訓練和學習,從而調整模型參數,并將調整后的模型參數進行存儲。
所述的步驟S1包括以下子步驟:
S11.從醫保數據庫中提取原始數據;
S12.構造數據篩選器,對提取的原始數據進行聚類和篩選,得到可疑數據特征簇C;
S13.將可疑數據特征簇C交由人工進行進一步判斷;
S14.根據人工判斷結果,對可疑數據特征簇C中的每條特征數據均使用標簽x進行標注,并將標注后的數據加入待訓練數據集作為待訓練數據,標簽x為0或者1,標簽x為0是代表對應的特征數據為正常數據,標簽x為1時代表對應的特征數據為異常數據。
所述的步驟S2包括以下子步驟:
S21.初始化訓練模型的參數;
S22.從待訓練數據集中提取待訓練數據,采用訓練模型對當前訓練數據進行檢測得到其檢測值y;
S23.計算當前數據檢測值y與標簽x之間的差值,記為損失β=|x-y|,利用損失β=|x-y|對訓練模型的參數進行調整;
S24.計算當前訓練模型的成熟度,作為在線學習階段模型成熟的依據;判斷訓練模型的成熟度是否滿足預設條件:
(1)訓練模型成熟度滿足條件時,定義認為模型訓練成熟,即可以使用,同時保存成熟模型的參數,訓練結束;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于成都數聯易康科技有限公司,未經成都數聯易康科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201510760477.4/2.html,轉載請聲明來源鉆瓜專利網。
- 同類專利
- 專利分類
G06F 電數字數據處理
G06F19-00 專門適用于特定應用的數字計算或數據處理的設備或方法
G06F19-10 .生物信息學,即計算分子生物學中的遺傳或蛋白質相關的數據處理方法或系統
G06F19-12 ..用于系統生物學的建模或仿真,例如:概率模型或動態模型,遺傳基因管理網絡,蛋白質交互作用網絡或新陳代謝作用網絡
G06F19-14 ..用于發展或進化的,例如:進化的保存區域決定或進化樹結構
G06F19-16 ..用于分子結構的,例如:結構排序,結構或功能關系,蛋白質折疊,結構域拓撲,用結構數據的藥靶,涉及二維或三維結構的
G06F19-18 ..用于功能性基因組學或蛋白質組學的,例如:基因型–表型關聯,不均衡連接,種群遺傳學,結合位置鑒定,變異發生,基因型或染色體組的注釋,蛋白質相互作用或蛋白質核酸的相互作用
- 數據顯示系統、數據中繼設備、數據中繼方法、數據系統、接收設備和數據讀取方法
- 數據記錄方法、數據記錄裝置、數據記錄媒體、數據重播方法和數據重播裝置
- 數據發送方法、數據發送系統、數據發送裝置以及數據結構
- 數據顯示系統、數據中繼設備、數據中繼方法及數據系統
- 數據嵌入裝置、數據嵌入方法、數據提取裝置及數據提取方法
- 數據管理裝置、數據編輯裝置、數據閱覽裝置、數據管理方法、數據編輯方法以及數據閱覽方法
- 數據發送和數據接收設備、數據發送和數據接收方法
- 數據發送裝置、數據接收裝置、數據收發系統、數據發送方法、數據接收方法和數據收發方法
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置





