[發明專利]醫療同義詞的確定方法和裝置在審
| 申請號: | 201710152584.8 | 申請日: | 2017-03-15 |
| 公開(公告)號: | CN106933806A | 公開(公告)日: | 2017-07-07 |
| 發明(設計)人: | 鄧侃;孫風磊;邱鵬飛;李丕勛 | 申請(專利權)人: | 北京大數醫達科技有限公司 |
| 主分類號: | G06F17/27 | 分類號: | G06F17/27;G06F17/30 |
| 代理公司: | 北京品源專利代理有限公司11332 | 代理人: | 孟金喆,胡彬 |
| 地址: | 100193 北京市海淀區東北旺*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 醫療 同義詞 確定 方法 裝置 | ||
技術領域
本發明實施例涉及計算機應用技術領域,尤其涉及一種醫療同義詞的確定方法和裝置。
背景技術
病歷是醫務人員對患者疾病的發生、發展、轉歸,進行檢查、診斷、治療等醫學活動過程所作的文字記錄。病歷既是臨床實踐工作的總結,又是探索疾病規律及處理醫學糾紛的法律依據,是國家的寶貴財富。
在臨床醫學中,有效整理病歷,從中挖掘醫生臨床經驗,對醫學進步具有重大意義。但是,由于醫務人員錄入病歷的時候,經常混雜大量不規范的同義詞表述、縮寫用法,甚至還有錯別字,而且使用的句型不僅多樣化,還可能不規范,給病歷整理工作帶來極大不便。若單純依靠人工整理的方式,工作量較大,且效率較低。因此,如何識別病歷中的各項內容的準確表述顯得尤為重要。
發明內容
本發明提供了一種醫療同義詞的確定方法和裝置,以解決現有的病歷中表述不規范而造成的病歷中的內容識別困難的問題。
第一方面,本發明實施例提供了一種醫療同義詞的確定方法,該方法包括:
獲取病歷樣本中至少一個自然語句,并對所述自然語句進行分詞;
在預先建立的醫學知識庫中,獲取與分詞后的詞語所對應的醫學標準化用語,作為所述詞語的候選同義詞;
根據同一病歷樣本中各詞語的關聯關系以及所述醫學知識庫中各所述醫學標準化術語之間的拓撲關系,從所述候選同義詞中確定出各所述詞語的目標同義詞。
第二方面,本發明實施例還提供了一種醫療同義詞的確定裝置,該裝置包括:
病歷分詞模塊,用于獲取病歷樣本中至少一個自然語句,并對所述自然語句進行分詞;
候選同義詞獲取模塊,用于在預先建立的醫學知識庫中,獲取與分詞后的詞語所對應的醫學標準化用語,作為所述詞語的候選同義詞;
目標同義詞確定模塊,用于根據同一病歷樣本中各詞語的關聯關系以及所述醫學知識庫中各所述醫學標準化術語之間的拓撲關系,從所述候選同義詞中確定出各所述詞語的目標同義詞。
本發明實施例的技術方案,通過對病歷樣本中的自然語句進行分詞,進而在醫學知識庫中獲取分詞后各詞語對應的各醫學標準化術語,確定出各詞語可能的候選同義詞,進而通過同一病歷中與各詞語相關的詞語,以及醫學知識庫中與各醫學標準化術語相關的各醫學標準化術語,從而進一步從各候選的各醫學標準化術語中,更加精確地確定出各詞語對應的醫學標準化用語,即從候選同義詞中確定出目標同義詞,不僅解決了現有的病歷中表述不規范而造成的病歷中的內容識別困難的問題,能夠結合醫學知識,更加準確、高效地確定出各詞語的目標同義詞。
附圖說明
為了更加清楚地說明本發明示例性實施例的技術方案,下面對描述實施例中所需要用到的附圖做一簡單介紹。顯然,所介紹的附圖只是本發明所要描述的一部分實施例的附圖,而不是全部的附圖,對于本領域普通技術人員,在不付出創造性勞動的前提下,還可以根據這些附圖得到其他的附圖。
圖1為本發明實施例一所提供的一種醫療同義詞的確定方法的流程示意圖;
圖2A為本發明實施例二所提供的一種醫療同義詞的確定方法的流程示意圖;
圖2B為本發明實施例二所提供的一種字向量生成方法的流程示意圖;
圖3為本發明實施例三所提供的一種醫療同義詞的確定裝置的結構示意圖。
具體實施方式
下面結合附圖并通過具體實施方式來進一步說明本發明的技術方案。可以理解的是,此處所描述的具體實施例僅僅用于解釋本發明,而非對本發明的限定。另外還需要說明的是,為了便于描述,附圖中僅示出了與本發明相關的部分而非全部結構。
在更加詳細地討論示例性實施例之前應當提到的是,一些示例性實施例被描述成作為流程圖描繪的處理或方法。雖然流程圖將各步驟描述成順序的處理,但是其中的許多步驟可以被并行地、并發地或者同時實施。此外,各步驟的順序可以被重新安排。當其操作完成時所述處理可以被終止,但是還可以具有未包括在附圖中的附加步驟。所述處理可以對應于方法、函數、規程、子例程、子程序等等。
實施例一
圖1為本發明實施例一所提供的一種醫療同義詞的確定方法的流程示意圖。如圖1所示,本實施例的方法可以由醫療同義詞的確定裝置來執行,該裝置可通過硬件和/或軟件的方式實現,并一般可獨立的配置在服務器中或者由終端和服務器配合實現本實施例的方法。,
本實施例的方法具體包括:
S110、獲取病歷樣本中至少一個自然語句,并對所述自然語句進行分詞。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京大數醫達科技有限公司,未經北京大數醫達科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710152584.8/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種大數據集中生物事件觸發詞的識別方法
- 下一篇:備忘錄事件提醒方法及系統





