[發(fā)明專利]一種醫(yī)療術(shù)語抽取方法及裝置有效
| 申請?zhí)枺?/td> | 201711448103.4 | 申請日: | 2017-12-27 |
| 公開(公告)號: | CN108170677B | 公開(公告)日: | 2022-01-04 |
| 發(fā)明(設(shè)計(jì))人: | 孟慶偉;胡可云;陳聯(lián)忠 | 申請(專利權(quán))人: | 北京嘉和海森健康科技有限公司 |
| 主分類號: | G06F40/30 | 分類號: | G06F40/30;G16H50/20 |
| 代理公司: | 北京集佳知識產(chǎn)權(quán)代理有限公司 11227 | 代理人: | 王寶筠 |
| 地址: | 100085 北京市海淀區(qū)上*** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 醫(yī)療 術(shù)語 抽取 方法 裝置 | ||
本申請公開了一種醫(yī)療術(shù)語抽取方法及裝置,在獲取目標(biāo)電子病歷中的自由文本后,可以利用預(yù)先建立的信息抽取模型對所述自由文本進(jìn)行信息抽取,獲取所述信息抽取模型所抽取到的醫(yī)療術(shù)語集合;然后,由于某些醫(yī)療術(shù)語之間預(yù)先定義了承接關(guān)系,因此,在所述醫(yī)療術(shù)語集合中,為預(yù)先定義有承接關(guān)系的每組醫(yī)療術(shù)語建立對應(yīng)的承接關(guān)系。這樣,可以使抽取出的醫(yī)療術(shù)語之間的承接關(guān)系得以體現(xiàn),從而可以根據(jù)預(yù)定義屬性對抽取出的醫(yī)療術(shù)語進(jìn)行準(zhǔn)確地歸類,避免了抽取結(jié)果存在偏差,從而提高了醫(yī)療術(shù)語抽取結(jié)果的準(zhǔn)確性,進(jìn)而可以滿足醫(yī)生對自由文本處理結(jié)果的需求。
技術(shù)領(lǐng)域
本申請涉及計(jì)算機(jī)技術(shù)領(lǐng)域,尤其涉及一種醫(yī)療術(shù)語抽取方法及裝置。
背景技術(shù)
病歷包括門(急)診病歷和住院病歷,病歷是醫(yī)務(wù)人員對患者疾病的發(fā)生、發(fā)展、轉(zhuǎn)歸,進(jìn)行檢查、診斷、治療等醫(yī)療活動(dòng)過程的記錄,也是對采集到的資料加以歸納、整理、綜合分析,按規(guī)定的格式和要求書寫的患者醫(yī)療健康檔案。病歷既是臨床實(shí)踐工作的總結(jié),又是探索疾病規(guī)律及處理醫(yī)療糾紛的法律依據(jù),病歷對醫(yī)療、預(yù)防、教學(xué)、科研、醫(yī)院管理等都有重要的作用。
電子病歷也叫計(jì)算機(jī)化的病案系統(tǒng)或稱基于計(jì)算機(jī)的病人記錄。它是用電子設(shè)備(計(jì)算機(jī)、健康卡等)保存、管理、傳輸和重現(xiàn)的數(shù)字化的病人的醫(yī)療記錄,取代手寫紙張病歷,它的內(nèi)容包括紙張病歷的所有信息。美國國立醫(yī)學(xué)研究所將其定義為:電子病歷是基于一個(gè)特定系統(tǒng)的電子化病人記錄,該系統(tǒng)提供用戶訪問完整準(zhǔn)確的數(shù)據(jù)、警示、提示和臨床決策支持系統(tǒng)的能力。
把電子病歷文本里包含的信息通過信息抽取技術(shù)進(jìn)行結(jié)構(gòu)化處理,變成表格一樣的組織形式。信息抽取系統(tǒng)中輸入的是原始電子病歷文本,輸出的是固定格式的信息點(diǎn)。信息點(diǎn)從各種各樣的文本中被抽取出來,然后以統(tǒng)一的形式集成在一起,這就是信息抽取的主要任務(wù)。信息以統(tǒng)一的形式集成在一起的好處是方便檢查和比較,通過抽取后的信息點(diǎn)進(jìn)行大數(shù)據(jù)分析和機(jī)器學(xué)習(xí),滿足醫(yī)療工作者在科研工作中對某些指標(biāo)的需要,比如,需要統(tǒng)計(jì)2015年至2017年以胸痛為主要癥狀入院的心絞痛患者在所有心絞痛患者之間的發(fā)病概率。
隨著醫(yī)療工作者科研水平的提高,對信息點(diǎn)的要求也越來越細(xì),多層次的進(jìn)行醫(yī)療術(shù)語的抽取越來越成為需求的必要。目前,醫(yī)療文本的信息抽取,多采用字典匹配及正則表達(dá)式抽取。
字典匹配即建立不同屬性的字典,通過字典中詞語的具體屬性來確定文本中詞語的類型,如“流行性感冒”是一個(gè)疾病詞語,通過疾病字典的匹配,計(jì)算機(jī)可以知道“流行性感冒”是疾病范疇的詞語,進(jìn)而可以正確的分詞。
正則表達(dá)式是通過建立不同的類,通過分析與類相關(guān)的字節(jié),使相應(yīng)的字節(jié)為這個(gè)類的屬性,如醫(yī)學(xué)文本中的“肺部可及濕啰音”,表達(dá)的是通過醫(yī)生聽診,可以在患者的肺部聽到“濕啰音”,正則表達(dá)式的輸出結(jié)果及“濕啰音”這個(gè)類的部位屬性為:肺部,標(biāo)志位的屬性為“是”(可及的意思,不同的文義中,意思相同的表達(dá)輸出為標(biāo)準(zhǔn)的一種結(jié)構(gòu))。
自由文本通過字典匹配或正則表達(dá)式能輸出簡單的邏輯關(guān)系,但醫(yī)學(xué)上的表達(dá)邏輯相對來說更為復(fù)雜,如咳嗽和咳痰的關(guān)系,按照醫(yī)學(xué)字典匹配,這兩者均為癥狀,但咳嗽為咳痰的前提,有咳痰肯定有咳嗽,反之則不然。通過詞典和正則表達(dá)式的匹配也不能解決醫(yī)學(xué)上一些詞語屬性的歸類問題,如腫瘤患者化療后會(huì)出現(xiàn)惡心、嘔吐、腹瀉等癥狀,如果單純的通過字典匹配,則抽取結(jié)果會(huì)有偏差,且解決不了醫(yī)生對自由文本處理結(jié)果的需求。
發(fā)明內(nèi)容
有鑒于此,本申請實(shí)施例的主要目的在于提供一種醫(yī)療術(shù)語抽取方法及裝置,能夠提高醫(yī)療術(shù)語抽取結(jié)果的準(zhǔn)確性。
第一方面,本申請?zhí)峁┝艘环N醫(yī)療術(shù)語抽取方法,包括:
獲取目標(biāo)電子病歷中的自由文本;
利用預(yù)先建立的信息抽取模型對所述自由文本進(jìn)行信息抽取,其中,所述信息抽取模型包括至少兩個(gè)屬性模型,所述屬性模型用于抽取與預(yù)定義屬性相關(guān)的至少一個(gè)信息點(diǎn)對應(yīng)的醫(yī)療術(shù)語;
獲取所述信息抽取模型所抽取到的醫(yī)療術(shù)語集合;
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于北京嘉和海森健康科技有限公司,未經(jīng)北京嘉和海森健康科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201711448103.4/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 一種領(lǐng)域術(shù)語抽取的方法
- 醫(yī)學(xué)術(shù)語識別方法及裝置
- 術(shù)語抽取方法和裝置
- 一種醫(yī)療術(shù)語知識庫完善的方法和裝置
- 一種構(gòu)建制造領(lǐng)域術(shù)語庫的方法及系統(tǒng)
- 術(shù)語更新方法以及相關(guān)設(shè)備、裝置
- 一種醫(yī)學(xué)術(shù)語系統(tǒng)的構(gòu)建方法、裝置、設(shè)備及存儲介質(zhì)
- 一種基于多特征的術(shù)語檢索方法
- 一種術(shù)語替換方法及系統(tǒng)
- 一種標(biāo)準(zhǔn)術(shù)語確定方法、裝置及存儲介質(zhì)





