[發明專利]支持異構信息集成的乳腺鉬靶報告語義樹模型建立方法在審
| 申請號: | 201910256713.7 | 申請日: | 2019-04-01 |
| 公開(公告)號: | CN110085290A | 公開(公告)日: | 2019-08-02 |
| 發明(設計)人: | 李繼云;孫莉;黃鵬;顧瑩瑩;李凱華;樂嘉錦 | 申請(專利權)人: | 東華大學 |
| 主分類號: | G16H15/00 | 分類號: | G16H15/00;G06F16/31;G06F16/34;G06F16/36 |
| 代理公司: | 上海申匯專利代理有限公司 31001 | 代理人: | 翁若瑩;柏子雵 |
| 地址: | 201600 上*** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 文本描述 語義樹 乳腺鉬靶 異構信息 鉬靶影像 乳腺癌 模型建立 數據庫 文本 短語 語義 實時獲取 文本信息 語義信息 語義約束 規范化 結構化 構建 表現 醫生 | ||
本發明涉及一種支持異構信息集成的乳腺鉬靶報告語義樹模型建立方法,其特征在于,包括以下步驟:形成乳腺癌鉬靶影像表現文本描述的文本規范化數據庫;實時獲取乳腺癌鉬靶影像表現的文本描述,根據語義信息基于文本規范化數據庫對文本描述進行短語的劃分;獲得實體的語義約束;形成文本描述的語義樹。本發明通過構建乳腺鉬靶語義樹的方式實現將來自不同醫院的、不同醫生的、復雜的乳腺癌鉬靶影像的文本信息結構化,實現異構信息的基于語義的集成。
技術領域
本發明涉及一種支持異構信息集成的乳腺鉬靶報告語義樹模型建立方法,屬于醫學文本結構化處理領域。
背景技術
隨著醫療信息化的高速發展,目前80%的醫院已經完成了信息化服務建設。如今電子病歷也已經代替了紙質病歷,但不變的是患者的診斷報告仍舊是根據醫生的知識以及工作經驗借助自然語言對相關部位非結構化的描述,可自然語言卻是計算機不能直接識別與處理的。
文本結構化處理作為人工智能在醫療領域發展的關鍵,MedLEE(MedicalLanguage Extraction and Encoding System)、UMLS(The Unified Medical LanguageSystem)等國外的自然語言處理系統已經很完善,但由于中文與英文在語義、語法結構上的巨大差異,對中文醫學文本的可移植性較差。國內對醫學文本結構化的研究起步較晚,借鑒了國外已有的技術也取得了許多突破性的進展,但對于乳腺鉬靶影像診斷報告文本結構化的研究尚少。
發明內容
本發明的目的是:提供一種乳腺鉬靶影像診斷報告文本結構化處理方法。
為了達到上述目的,本發明的技術方案是提供了一種支持異構信息集成的乳腺鉬靶報告語義樹模型建立方法,其特征在于,包括以下步驟:
步驟1、根據專家規則形成乳腺癌鉬靶影像表現文本描述的文本規范化數據庫,文本規范化數據庫中存儲有與乳腺癌鉬靶影像表現文本描述相關的符合現行醫學術語規范的短語;
步驟2、實時獲取乳腺癌鉬靶影像表現的文本描述,根據語義信息基于文本規范化數據庫對文本描述進行短語的劃分并且將不需要的冗余信息去除,提取與乳腺癌診斷相關的描述,劃分各個實體的范圍,其中,利用病灶的分類結果,將每一個病變作為一個實體;
步驟3、獲得實體的語義約束;
步驟4、形成步驟2獲得的文本描述的語義樹,語義樹的根節點為實體,語義樹的內部節點是實體的每個屬性,葉子節點為每個屬性對應的屬性描述。
優選地,還包括步驟5:對上一步獲得的語義樹進行可視化展示。
本發明通過構建乳腺鉬靶語義樹的方式實現將來自不同醫院的、不同醫生的、復雜的乳腺癌鉬靶影像的文本信息結構化,實現異構信息的基于語義的集成。
附圖說明
圖1為中文乳腺鉬靶影像表現文本語義樹構建流程圖,主要過程如下:輸入待處理的乳腺鉬靶影像文本;對文本進行分詞;根據文本特點找出語義樹的主要節點,并且利用其語義約束找到其葉子節點;根據輸入順序將語義樹的節點掛上葉子節點,完成對該語義樹的掃描。
圖2中文乳腺鉬靶影像表現的文本分詞樣例,選取了一條乳腺癌目靶影像文本描述中的一個子句,進行分詞的結果,從分詞的結果,在不考慮省略的情況下,可以看出中文乳腺鉬靶影像表現文本中一個子句的句法結構可以概括為位置+主語+謂詞+不同屬性描述。利用這樣的結構可以快速找到對應于詞語的類別。
圖3中文乳腺鉬靶影像表現的語義樹語義約束構造,是在進行了分詞的基礎上,將對于實體的相關描述根據其特點進行歸類的結果。主要是利用詞語的詞性特點以及利用專家規則所構建的數據庫中所存放的詞語,對每一關鍵詞語都賦予一個類別。將不需要的冗余詞語丟棄。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于東華大學,未經東華大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910256713.7/2.html,轉載請聲明來源鉆瓜專利網。





