[發明專利]醫療文本數據的處理方法、裝置、計算機設備和存儲介質有效
| 申請號: | 202010583894.7 | 申請日: | 2020-06-23 |
| 公開(公告)號: | CN111797629B | 公開(公告)日: | 2022-07-29 |
| 發明(設計)人: | 許水琴 | 申請(專利權)人: | 平安醫療健康管理股份有限公司 |
| 主分類號: | G06F40/295 | 分類號: | G06F40/295;G06F40/216;G06F16/35;G06N3/04;G06N7/00 |
| 代理公司: | 深圳市明日今典知識產權代理事務所(普通合伙) 44343 | 代理人: | 王杰輝 |
| 地址: | 200000 上海市黃浦*** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 醫療 文本 數據 處理 方法 裝置 計算機 設備 存儲 介質 | ||
本申請涉及人工智能技術領域,提供醫療文本數據的處理方法、裝置、計算機設備和存儲介質,包括:獲取醫療文本數據;分別輸入至第一識別模型、第二識別模型以及第三識別模型中;分別通過第一識別模型、第二識別模型、第三識別模型預測醫療文本數據中每個字符對應的第一標注結果、第二標注結果、第三標注結果;判斷第一標注結果、第二標注結果、第三標注結果是否相同;當標注結果相同時,將第一標注結果確定為字符對應的標注結果;提取醫療文本數據中的命名實體,進行支付測算處理。本申請中通過多個模型的預測一致性,來提升模型預測的準確率,從而提升命名實體識別的準確率。本申請中的方案可應用于智慧醫療領域中,從而推動智慧城市的建設。
技術領域
本申請涉及人工智能的技術領域,特別涉及一種醫療文本數據的處理方法、裝置、計算機設備和存儲介質。
背景技術
傳統的支付測算的主要流程為:人工采集歷史數據,收集近三年實施區不同醫療機構中住院的病案首頁信息和費用明細;人工將數據保存到excel表格里;對excel數據進行人工分析篩選二次處理;人工篩選支付數據計算相關指標數據,同時預測未來的支付標準,生成相應的測算結果。此傳統方法存在諸多弊端,例如:1、程序繁瑣,有比較大的滯后性;2、占用人力物力;3、人工操作容易出差錯,且不同的人計算方法有各種差異,標準不統一,造成測算結果不準確;4、方法不利于復用,造成大量重復勞力。
因此,目前出現采用支付預算工具進行自動化支付測算,如基于drg支付的支付測算工具。在基于drg支付的支付測算工具中,需要準確識別出醫療文本數據中包括的醫院名稱、地域、科室等命名實體;而目前的識別準確率較低,不利于進行支付測算。
發明內容
本申請的主要目的為提供一種醫療文本數據的處理方法、裝置、計算機設備和存儲介質,旨在克服目前無法準確識別醫療文本數據中包括的命名實體的缺陷。
為實現上述目的,本申請提供了一種醫療文本數據的處理方法,包括以下步驟:
獲取醫療文本數據;
將所述醫療文本數據分別輸入至第一識別模型、第二識別模型以及第三識別模型中;其中,所述第一識別模型為基于公開數據集訓練BiLSTM-CRF模型所得到,所述第二識別模型為基于醫療領域數據集訓練BiLSTM-CRF模型所得到,所述第三識別模型為基于所述公開數據集以及醫療領域數據集訓練BiLSTM-CRF模型所得到;
通過所述第一識別模型預測所述醫療文本數據中每個字符對應為各個標注的第一概率;通過所述第二識別模型預測所述醫療文本數據中每個字符對應為各個標注的第二概率;通過所述第三識別模型預測所述醫療文本數據中每個字符對應為各個標注的第三概率;其中,所述第一概率最大的標注作為所述第一識別模型預測所述字符的第一標注結果,所述第二概率最大的標注作為所述第二識別模型預測所述字符的第二標注結果,所述第三概率最大的標注作為所述第三識別模型預測所述字符的第三標注結果;
分別判斷每個所述字符對應的所述第一標注結果、第二標注結果、第三標注結果是否相同;
若相同,則將所述第一標注結果確定為所述字符對應的標注結果;
根據所述標注結果,提取所述醫療文本數據中的命名實體,將所述命名實體輸入至支付測算工具中進行支付測算處理。
進一步地,所述分別判斷每個所述字符對應的所述第一標注結果、第二標注結果、第三標注結果是否相同的步驟之后,包括:
若不相同,則根據所述第一識別模型預測所述字符為所述第三標注結果的第一概率、所述第二識別模型預測所述字符為所述第三標注結果的第二概率、所述第三識別模型預測所述字符為第三標注結果的第三概率,以及所述第一識別模型、第二識別模型、第三識別模型的預測結果對應的預設權重,計算所述字符預測為所述第三標注結果的總概率;
判斷所述總概率是否大于閾值,若是,則將所述第三標注結果作為所述字符對應的標注結果;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于平安醫療健康管理股份有限公司,未經平安醫療健康管理股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010583894.7/2.html,轉載請聲明來源鉆瓜專利網。
- 數據顯示系統、數據中繼設備、數據中繼方法、數據系統、接收設備和數據讀取方法
- 數據記錄方法、數據記錄裝置、數據記錄媒體、數據重播方法和數據重播裝置
- 數據發送方法、數據發送系統、數據發送裝置以及數據結構
- 數據顯示系統、數據中繼設備、數據中繼方法及數據系統
- 數據嵌入裝置、數據嵌入方法、數據提取裝置及數據提取方法
- 數據管理裝置、數據編輯裝置、數據閱覽裝置、數據管理方法、數據編輯方法以及數據閱覽方法
- 數據發送和數據接收設備、數據發送和數據接收方法
- 數據發送裝置、數據接收裝置、數據收發系統、數據發送方法、數據接收方法和數據收發方法
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置





