[發明專利]一種病歷文本中患者基本信息的檢查方法及系統在審
| 申請號: | 202110132076.X | 申請日: | 2021-01-31 |
| 公開(公告)號: | CN112800767A | 公開(公告)日: | 2021-05-14 |
| 發明(設計)人: | 李雪;沈潔;劉升平;梁家恩 | 申請(專利權)人: | 云知聲智能科技股份有限公司;廈門云知芯智能科技有限公司 |
| 主分類號: | G06F40/295 | 分類號: | G06F40/295;G16H10/60 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 100096 北京市海*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 病歷 文本 患者 基本信息 檢查 方法 系統 | ||
本發明涉及一種病歷文本中患者基本信息的檢查方法及系統,該方法包括:步驟1、利用文本抽取,從病歷首頁獲取患者的第一基本信息實體,以及病歷中描述患者病情的病歷描述文本;步驟2、根據所述第一基本信息實體,從所述病歷描述文本中抽取第二基本信息實體;步驟3、根據標準基本信息對所述第一基本信息實體和所述第二基本信息實體進行檢查。本發明利用文本抽取和比對的方式,能夠自動化完成對病歷文本中患者基本信息的檢查,大大提高了檢查效率和檢查質量。
技術領域
本發明涉及文本處理領域,具體涉及一種病歷文本中患者基本信息的檢查方法及系統。
背景技術
一份病歷中,除了病案首頁填寫患者的基本信息外,查房記錄,病程記錄等文書中會多次描述患者的基本信息(姓名、性別、年齡等),其中可能會存在書寫錯誤的文書,目前是采用人工校驗核對的方式,工作量大、效率低且容易出現漏檢的情況。
發明內容
本發明提供一種病歷文本中患者基本信息的檢查方法及系統,能夠解決現有人工檢查方式存在的上述技術問題。
本發明解決上述技術問題的技術方案如下:
第一方面,本發明提供一種病歷文本中患者基本信息的檢查方法,包括:
步驟1、利用文本抽取,從病歷首頁獲取患者的第一基本信息實體,以及病歷中描述患者病情的病歷描述文本;
步驟2、根據所述第一基本信息實體,從所述病歷描述文本中抽取第二基本信息實體;
步驟3、根據標準基本信息對所述第一基本信息實體和所述第二基本信息實體進行檢查。
本發明的有益效果是:利用文本抽取和比對的方式,能夠自動化完成對病歷文本中患者基本信息的檢查,大大提高了檢查效率和檢查質量。
進一步,步驟2具體包括:
步驟2.1、利用所述第一基本信息實體對所述病歷描述文本進行回標,得到粗標數據;
步驟2.2、利用預先構建的規則集對所述粗標數據進行規則修正和增強,得到修正數據;
步驟2.3、采用預訓練語言模型在所述修正數據上進行微調,得到預測結果;
步驟2.4、根據所述預測結果,完善所述規則集;
重復執行步驟2.2-步驟2.4,直到所述預訓練語言模型的預測效果不再提升。
上述進一步方案的有益效果是,利用規則集能夠有效識別標注錯誤的數據,并利用預訓練語言模型強大的信息表征能力和泛化能力,可以顯著提升信息抽取的有效性。
進一步,步驟2.1中,在利用所述第一基本信息實體對所述病歷描述文本進行回標之前,還包括對所述病歷描述文本進行清洗的步驟。
上述進一步方案的有益效果是,通過對文本進行清洗,能夠減少文本中的無用信息。
進一步,所述預訓練語言模型采用BERT+CRF。
進一步,步驟3具體包括:
比較標準基本信息與所述第一基本信息實體和第二基本信息實體,若不能完全匹配,則生成基本信息填寫錯誤的提示信息。
第二方面,本發明提供一種病歷文本中患者基本信息的檢查系統,包括:
第一抽取模塊,用于利用文本抽取,從病歷首頁獲取患者的第一基本信息實體,以及病歷中描述患者病情的病歷描述文本;
第二抽取模塊,用于根據所述第一基本信息實體,從所述病歷描述文本中抽取第二基本信息實體;
檢查模塊,用于根據標準基本信息對所述第一基本信息實體和所述第二基本信息實體進行檢查。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于云知聲智能科技股份有限公司;廈門云知芯智能科技有限公司,未經云知聲智能科技股份有限公司;廈門云知芯智能科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110132076.X/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種加速AI模型部署的方法和設備
- 下一篇:一種可變形吸盤的控制方法





