[發明專利]病歷事件元素抽取方法、裝置、電子設備和存儲介質在審
| 申請號: | 202110132072.1 | 申請日: | 2021-01-31 |
| 公開(公告)號: | CN112749564A | 公開(公告)日: | 2021-05-04 |
| 發明(設計)人: | 史亞飛;李霄寒 | 申請(專利權)人: | 云知聲智能科技股份有限公司;廈門云知芯智能科技有限公司 |
| 主分類號: | G06F40/295 | 分類號: | G06F40/295;G16H10/60 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 100096 北京市海*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 病歷 事件 元素 抽取 方法 裝置 電子設備 存儲 介質 | ||
本發明涉及一種病歷事件元素抽取方法、裝置、電子設備和存儲介質,該方法包括:獲取待抽取事件元素的病歷文本;識別病歷文本對應的診斷依據片段;根據診斷依據片段識別事件類型;判斷事件類型中是否包括主事件和從事件;若判斷結果為事件類型中包括主事件和/或從事件,則從主事件和/或從事件中抽取實體元素。通過從病歷文本中識別出包含診斷依據片段的文書,從診斷依據片段中識別出主從事件,從主從事件中抽取事件元素,每一級別都能精準定位到目標單元。每一級別的特征都會在這一級別的信息提取過程中得到強化,每一級別定位更精確,錯誤傳遞減少,最里面的層級信息更準確,從而不會弱化每一個層級所包含獨特的信息。
技術領域
本發明涉及互聯網應用技術領域,具體涉及一種病歷事件元素抽取方法、裝置、電子設備和存儲介質。
背景技術
目前,事件元素抽取是分別提取句子級別特征、段落級別特征、文檔級別特征,然后融合三個層次的特征得到融合全文信息的特征,基于融合全文信息的特征和標注的標簽,通過有監督的深度學習算法,進行實體識別、事件識別和事件元素分類的訓練,得到事件抽取模型,然后抽取事件元素,上述三個層次特征融合信息融合的方式,雖然信息更全面,但同時也弱化了每一個層級所包含獨特的信息。
發明內容
本發明提供一種病歷事件元素抽取方法、裝置、電子設備和存儲介質,能夠解決上述弱化每一個層級所包含獨特的信息的技術問題。
本發明解決上述技術問題的技術方案如下:
一種病歷事件元素抽取方法,包括:
獲取待抽取事件元素的病歷文本;
識別病歷文本對應的診斷依據片段;
根據診斷依據片段識別事件類型;
判斷事件類型中是否包括主事件和從事件;
若判斷結果為事件類型中包括主事件和/或從事件,則從主事件和/或從事件中抽取實體元素。
在一些實施例中,識別病歷對應的診斷依據片段之前,上述方法還包括:對所述病歷文本進行結構化處理。
在一些實施例中,識別病歷文本對應的診斷依據片段、根據診斷依據片段識別事件類型和所述從主事件和/或從事件中抽取實體元素,均使用Bert+BiLSTM+CRF序列標注模型。
在一些實施例中,若判斷結果為所述事件類型中包括主事件和/或從事件,則從主事件和/或從事件中抽取實體元素,包括:
若判斷結果為事件類型中包括主事件和/或從事件,
則從主事件中抽取診斷實體元素;和/或,
從從事件中抽取陽性癥狀實體、陰性癥狀實體、陽性體征實體、陰性體征實體;和/或,
從從事件中抽取檢查實體、檢驗實體。
在一些實施例中,病歷中的事件元素抽取方法從從事件中抽取陽性癥狀實體、陰性癥狀實體、陽性體征實體、陰性體征實體;和/或,從從事件中抽取檢查實體、檢驗實體,包括:
從臨床表現事件中抽取陽性癥狀實體、陰性癥狀實體、陽性體征實體、陰性體征實體;和/或,
從輔助檢查事件中抽取檢查實體、檢驗實體。
在一些實施例中,從主事件和/或從事件中抽取實體元素抽取后,上述方法還包括:
構建病歷與實體元素的相關關系。
第二方面,本申請實施例還提供了一種病歷中事件元素抽取裝置,包括:
獲取模塊:用于獲取待抽取事件元素的病歷文本;
第一識別模塊:用于識別病歷文本對應的診斷依據片段;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于云知聲智能科技股份有限公司;廈門云知芯智能科技有限公司,未經云知聲智能科技股份有限公司;廈門云知芯智能科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110132072.1/2.html,轉載請聲明來源鉆瓜專利網。





