[發明專利]實體鏈接方法、裝置、存儲介質及電子設備在審
| 申請號: | 201811330154.1 | 申請日: | 2018-11-09 |
| 公開(公告)號: | CN109522551A | 公開(公告)日: | 2019-03-26 |
| 發明(設計)人: | 劉旭;劉學梁;王琛;季思偉 | 申請(專利權)人: | 天津新開心生活科技有限公司;天津開心生活科技有限公司 |
| 主分類號: | G06F17/27 | 分類號: | G06F17/27;G06F17/28;G06F16/36;G16H15/00 |
| 代理公司: | 北京律智知識產權代理有限公司 11438 | 代理人: | 袁禮君;闞梓瑄 |
| 地址: | 300467 天津市濱海新區天津生態城國*** | 國省代碼: | 天津;12 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 鏈接 詞條 候選集合 語義 電子設備 計算機可讀存儲介質 表達方式 存儲介質 鏈接裝置 匹配特征 醫學術語 語義識別 準確率 預設 數據庫 文本 篩選 醫療 | ||
本公開涉及一種實體鏈接方法、實體鏈接裝置、計算機可讀存儲介質及電子設備,實體鏈接方法包括:從醫療文本中提取待鏈接實體;在標準詞條數據庫中篩選得到與所述待鏈接實體具有匹配特征的標準詞條的候選集合;通過預設模型為所述候選集合中的各個標準詞條提供語義相關性評分;將所述待鏈接實體鏈接至所述候選集合中的語義相關性評分最高的標準詞條。本公開通過對臨床中具有不同表達方式的醫學術語進行語義識別以將待鏈接實體鏈接至最接近的標準詞條,提高了實體鏈接方法的效率和準確率。
技術領域
本公開涉及數據處理技術領域,具體涉及一種實體鏈接方法、實體鏈接裝置、計算機可讀存儲介質及電子設備。
背景技術
在臨床病歷大數據的處理中,由于地域、醫院、醫生、標準等差異,同一實體往往有大量不同的表達方式,只有精確地識別出同一種實體,針對有限的實體空間,才能有效的對數據進行統計和計算。因此,醫學術語實體鏈接是數據處理過程中一個必不可少的部分。
現有的實體鏈接方法一般是通過分類等算法降低候選數量,然后通過相似度計算得到最接近的候選。作為現有實體鏈接系統的核心算法,相似度計算一般是通過建模事物特征,將特征轉化為向量,再通過計算向量距離來衡量相似的程度。
在現有的實體鏈接方法中,一般需要大量的標注語料,而專業的醫學知識難以加入到特征中用于計算。另外,基于相似度計算的實體鏈接方法可以很好的處理候選差異較大的情況,但是在面對候選相近的情況時通常很難處理。尤其是基于神經網絡的算法,不能很好地利用醫學相關知識,算法的計算過程也無法解釋。因此,在針對醫學領域的大數據處理中,亟需一種醫學術語實體鏈接方法,以解決上述問題。
需要說明的是,在上述背景技術部分公開的信息僅用于加強對本公開的背景的理解,因此可以包括不構成對本領域普通技術人員已知的現有技術的信息。
發明內容
本公開的目的在于提供一種實體鏈接方法、實體鏈接裝置、計算機可讀存儲介質及電子設備,進而至少在一定程度上解決由于相關技術的限制和缺陷而導致的處理難度大、可解釋性差、成本高以及難以管理和使用專業醫學知識等技術問題。
根據本公開的一個方面,提供一種實體鏈接方法,其特殊之處在于,包括:
從醫療文本中提取待鏈接實體;
在標準詞條數據庫中篩選得到與所述待鏈接實體具有匹配特征的標準詞條的候選集合;
通過預設模型為所述候選集合中的各個標準詞條提供語義相關性評分;
將所述待鏈接實體鏈接至所述候選集合中的語義相關性評分最高的標準詞條。
在本公開的一種示例性實施例中,所述在標準詞條數據庫中篩選得到與所述待鏈接實體具有匹配特征的標準詞條的集合包括:
對所述待鏈接實體進行分詞處理得到一個或者多個分詞單元;
在標準詞條數據庫中篩選得到與所述待鏈接實體的分詞單元具有匹配特征的標準詞條的集合。
在本公開的一種示例性實施例中,在步驟在標準詞條數據庫中篩選得到與所述待鏈接實體具有匹配特征的標準詞條的候選集合之后,所述方法還包括:
在所述標準詞條的候選集合中通過語義分析濾除與所述待鏈接實體語義不符的標準詞條。
在本公開的一種示例性實施例中,在所述標準詞條的候選集合中通過語義分析濾除與所述待鏈接實體語義不符的標準詞條包括:
對所述待鏈接實體進行語義角色標注,得到核心語義特征;
通過比較所述核心語義特征,在所述標準詞條的候選集合中濾除與所述待鏈接實體語義不符的標準詞條。
在本公開的一種示例性實施例中,所述比較所述核心語義特征包括:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于天津新開心生活科技有限公司;天津開心生活科技有限公司,未經天津新開心生活科技有限公司;天津開心生活科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811330154.1/2.html,轉載請聲明來源鉆瓜專利網。





