[發明專利]一種人體疾病癥狀特征自動抽取方法、系統及設備在審
| 申請號: | 201811325341.0 | 申請日: | 2018-11-08 |
| 公開(公告)號: | CN109545373A | 公開(公告)日: | 2019-03-29 |
| 發明(設計)人: | 呂軍震;胥洪鋒;于國方;李長松;王林;武佳 | 申請(專利權)人: | 新博卓暢技術(北京)有限公司 |
| 主分類號: | G16H50/20 | 分類號: | G16H50/20;G16H50/70 |
| 代理公司: | 北京馳納智財知識產權代理事務所(普通合伙) 11367 | 代理人: | 陳常美 |
| 地址: | 065001 河北省*** | 國省代碼: | 河北;13 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 人體疾病 維度信息 癥狀特征 癥狀體征 自動抽取 臨床病歷 病歷 抽取 文本 系統及設備 疾病特征 疾病知識 實體信息 特征學習 信息建立 醫學基礎 語義分析 表型 迭代 分詞 維度 語句 圖譜 門診 疾病 重復 更新 分析 研究 | ||
本發明提供一種人體疾病癥狀特征自動抽取方法及系統,其中方法包括提取病人病例,還包括以下步驟:分析總結病歷中維度信息;根據所述維度信息,總結醫學基礎知識;對病歷中的疾病特征語句進行分詞和語義分析;將所述疾病知識信息,與疾病和各維度信息對應生成json格式的實體信息;重復上述步驟,更新迭代知識圖譜。本發明提出一種人體疾病癥狀特征自動抽取方法及系統,結合門診臨床病歷文本開展癥癥狀體征信息的抽取方法研究,通過對癥狀體征信息建立維度,形成癥狀體征的模型,然后在使用NLP和特征學習等方法,來實現從臨床病歷現病史文本中抽取癥狀表型實體的要求。
技術領域
本發明涉及醫療診斷的技術領域,特別是一種人體疾病癥狀特征自動抽取方法及系統。
背景技術
隨著人們健康意識的不斷提高,越來越多的人開始關注自己的身體狀況。作為健康判斷標準的檢查化驗報告單,一般人很難看懂。由于目前國內醫患比例嚴重失調,醫生不可能詳盡的給每一個患者逐條解釋報告單的詳細信息。雖然伴隨著互聯網的普及,人們的知識來源越來越多,但是上面魚龍混雜,一般人根本無從分辨真假。
癥狀表型(癥狀體征)是臨床數據和醫學題錄文獻數據中重要的實體性信息,是中西醫診斷與治療的主要依據。但醫學數據中的癥狀表型信息往往以自由文本型的臨床病歷(以主訴和現病史為主要文本內容)和題錄文獻數據為主要載體。近年來,隨著大數據技術的突飛猛進,要從這些大量的文本數據中抽取完整信息顯得越來越突出。
申請號為CN108491472A的發明專利公開了一種基于CRF++分詞構建醫療特征庫的方法和系統,其中方法包括選取電子文本作為初始來源,包括以下步驟:從所述初始來源中提取特征信息;對所述特征信息進行分詞和語義分析;在所述CRF++分詞的模板中標注所述分詞;使用所述模板對所述初始來源進行表述和特征提取,生成疾病特征庫;重復上述3-4,迭代使用新提取的特征信息進行再次標注,直到沒有需要標注的特征。該方法的缺點在于,只要修飾詞的順序出現變化,就有可能導致CRF發現的特征出現偏差,進而出現抽取錯誤或者不全的癥狀特征。當文本來源于不同的渠道的時候,這種不同形式的表述就更加的多而且繁雜,對于模板的維護來說都是一個不小的維護工作。
發明內容
為了解決上述的技術問題,本發明提出一種人體疾病癥狀特征自動抽取方法及系統,結合門診臨床病歷文本開展癥癥狀體征信息的抽取方法研究,通過對癥狀體征信息建立維度,形成癥狀體征的模型,然后在使用NLP和特征學習等方法,來實現從臨床病歷現病史文本中抽取癥狀表型實體的要求。
本發明的第一目的是提供了一種人體疾病癥狀特征自動抽取方法,包括提取病人病例,還包括以下步驟:
步驟1:分析總結病歷中維度信息;
步驟2:根據所述維度信息,總結醫學基礎知識;
步驟3:對病歷中的疾病特征語句進行分詞和語義分析;
步驟4:將所述疾病知識信息,與疾病和各維度信息對應生成json格式的實體信息;
步驟5:重復上述步驟,更新迭代知識圖譜。
優選的是,所述維度信息包括性別,年齡、癥狀、部位、癥狀修飾詞、部位修飾詞、分泌物、排泄物、動作、特殊時期、患處、情感、氣味、聲音、動詞、大小和形狀中至少一種。
在上述任一方案中優選的是,所述步驟2還包括根據所述維度信息生成以上多個維度的知識原子單元。
在上述任一方案中優選的是,所述步驟3包括生成疾病特征語句依賴關系并將對應的詞進行實體標注和識別,并得到所述疾病知識信息。
在上述任一方案中優選的是,所述實體標注是指分析所述疾病特征語句中的詞匯,得到詞匯的語法詞性,刪除多余無用的詞匯,得到有用的詞匯。
在上述任一方案中優選的是,所述識別是指判斷所述有用的詞匯屬于哪一個維度信息。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于新博卓暢技術(北京)有限公司,未經新博卓暢技術(北京)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811325341.0/2.html,轉載請聲明來源鉆瓜專利網。





