[發(fā)明專利]一種醫(yī)療術(shù)語庫的形成方法和裝置有效
| 申請(qǐng)?zhí)枺?/td> | 201810444927.2 | 申請(qǐng)日: | 2018-05-10 |
| 公開(公告)號(hào): | CN108763197B | 公開(公告)日: | 2021-11-09 |
| 發(fā)明(設(shè)計(jì))人: | 梁平 | 申請(qǐng)(專利權(quán))人: | 上海依智醫(yī)療技術(shù)有限公司 |
| 主分類號(hào): | G06F40/216 | 分類號(hào): | G06F40/216;G06F40/58;G16H10/00 |
| 代理公司: | 北京同達(dá)信恒知識(shí)產(chǎn)權(quán)代理有限公司 11291 | 代理人: | 黃志華 |
| 地址: | 200336 上海市長寧*** | 國省代碼: | 上海;31 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 醫(yī)療 術(shù)語 形成 方法 裝置 | ||
本發(fā)明實(shí)施例涉及醫(yī)療術(shù)語庫領(lǐng)域,尤其涉及一種醫(yī)療術(shù)語庫的形成方法和裝置,用以解決對(duì)第二語言的醫(yī)療術(shù)語庫翻譯規(guī)模大的問題。本發(fā)明實(shí)施例中,從第一語言的醫(yī)療記錄中獲取第一語言的醫(yī)學(xué)短語;針對(duì)同一個(gè)醫(yī)學(xué)短語,從多個(gè)第一語言的醫(yī)學(xué)短語中篩選出數(shù)量大于設(shè)定閾值的,作為高頻的醫(yī)學(xué)短語;確定高頻的醫(yī)學(xué)短語在第二語言的醫(yī)學(xué)術(shù)語庫中對(duì)應(yīng)的第二語言的概念;從第二語言的醫(yī)學(xué)術(shù)語庫中獲取第二語言的概念對(duì)應(yīng)的第二語言的拓?fù)湫畔?;將第二語言的概念翻譯為第一語言的概念、將第二語言的拓?fù)湫畔⒎g為第一語言的拓?fù)湫畔ⅲ桓鶕?jù)多個(gè)第一語言的概念及多個(gè)第一語言的拓?fù)湫畔?,?gòu)建第一語言的醫(yī)學(xué)術(shù)語庫。減小翻譯第二語言的醫(yī)學(xué)短語的數(shù)量。
技術(shù)領(lǐng)域
本發(fā)明實(shí)施例涉及醫(yī)療術(shù)語庫領(lǐng)域,尤其涉及一種醫(yī)療術(shù)語庫的形成方法和裝置。
背景技術(shù)
自然語言處理是計(jì)算機(jī)科學(xué)領(lǐng)域與人工智能領(lǐng)域中的一個(gè)重要方向,相關(guān)研究的目的是實(shí)現(xiàn)人與計(jì)算機(jī)之間用自然語言進(jìn)行有效通信。知識(shí)圖譜是自然語言語義理解的基礎(chǔ),因此,知識(shí)圖譜便應(yīng)用而生。在醫(yī)療領(lǐng)域,存在大量的自由文本數(shù)據(jù)(例如電子病歷、紙質(zhì)病歷、醫(yī)學(xué)書籍),計(jì)算機(jī)是非常難處理和理解的。需要將自由文本數(shù)據(jù)轉(zhuǎn)化為計(jì)算機(jī)可以處理的數(shù)據(jù),目前,是由專業(yè)的醫(yī)生經(jīng)過長時(shí)間搭建了一個(gè)專業(yè)的醫(yī)療術(shù)語庫(Systematized Nomenclature of Medicine-Cl inical Terms,簡稱SNOMED CT),以實(shí)現(xiàn)將醫(yī)療領(lǐng)域中的自由文本轉(zhuǎn)化為計(jì)算機(jī)可以處理的數(shù)據(jù)。
由于醫(yī)療術(shù)語庫SNOMED是英文的,將SNOMED本地化對(duì)我國醫(yī)療信息的處理有著重大意義。現(xiàn)有技術(shù)中,將SNOMED本地化采用的方式是:利用軟件翻譯或者由人工翻譯所述SNOMED。利用軟件翻譯的質(zhì)量較差;利用人工翻譯成本較大,因此亟需相應(yīng)解決方案。
發(fā)明內(nèi)容
本發(fā)明實(shí)施例提供一種醫(yī)療術(shù)語庫的形成方法和裝置,用以解決現(xiàn)有技術(shù)中對(duì)第二語言醫(yī)療術(shù)語庫SNOMED的翻譯規(guī)模大的問題。
本發(fā)明實(shí)施例提供一種醫(yī)療術(shù)語庫的形成方法,包括:從至少一個(gè)第一語言的醫(yī)療記錄中獲取多個(gè)第一語言的醫(yī)學(xué)短語;針對(duì)同一個(gè)醫(yī)學(xué)短語,從所述多個(gè)第一語言的醫(yī)學(xué)短語中篩選出數(shù)量大于設(shè)定閾值的第一語言的醫(yī)學(xué)短語,作為高頻的醫(yī)學(xué)短語;針對(duì)每個(gè)高頻的醫(yī)學(xué)短語,執(zhí)行:確定所述高頻的醫(yī)學(xué)短語在第二語言的醫(yī)學(xué)術(shù)語庫中對(duì)應(yīng)的第二語言的概念;從所述第二語言的醫(yī)學(xué)術(shù)語庫中獲取所述第二語言的概念對(duì)應(yīng)的第二語言的拓?fù)湫畔?;將所述第二語言的概念翻譯為第一語言的概念、并將所述第二語言的拓?fù)湫畔⒎g為第一語言的拓?fù)湫畔?;根?jù)多個(gè)所述第一語言的概念以及多個(gè)所述第一語言的拓?fù)湫畔ⅲ瑯?gòu)建第一語言的醫(yī)學(xué)術(shù)語庫。
由于本發(fā)明實(shí)施例中,從所述多個(gè)第一語言的醫(yī)學(xué)短語中篩選出高頻的醫(yī)學(xué)短語,高頻的醫(yī)學(xué)短語相比于獲取到的全部第一語言的醫(yī)學(xué)短語,數(shù)量較少;且高頻的醫(yī)學(xué)短語是通過醫(yī)療記錄來獲得的,比較符合臨床實(shí)際使用情況,這樣可以保證臨床使用醫(yī)學(xué)短語的覆蓋率。之后將數(shù)量較少的高頻的醫(yī)學(xué)短語映射到第二語言的醫(yī)學(xué)術(shù)語庫中對(duì)應(yīng)的第二語言的概念,可能會(huì)是多個(gè)高頻的醫(yī)學(xué)短語對(duì)應(yīng)一個(gè)概念,因此,將第二語言的概念翻譯為第一語言的概念的數(shù)量進(jìn)一步減小,進(jìn)而有助于進(jìn)一步減小翻譯的成本。將獲取到的第二語言的概念對(duì)應(yīng)的第二語言的拓?fù)湫畔⒎g為第一語言的拓?fù)湫畔?,根?jù)多個(gè)所述第一語言的概念以及多個(gè)所述第一語言的拓?fù)湫畔ⅲ瑯?gòu)建第一語言的醫(yī)學(xué)術(shù)語庫。相比于現(xiàn)有技術(shù)將第二語言的醫(yī)療術(shù)語庫全部翻譯為第一語言的醫(yī)療術(shù)語庫,本發(fā)明實(shí)施例可以在盡可能保證臨床使用的醫(yī)學(xué)短語的覆蓋率的情況下,減小翻譯第二語言的醫(yī)學(xué)短語的數(shù)量,可降低構(gòu)建第一語言的醫(yī)學(xué)術(shù)語庫的成本。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于上海依智醫(yī)療技術(shù)有限公司,未經(jīng)上海依智醫(yī)療技術(shù)有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810444927.2/2.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 一種領(lǐng)域術(shù)語抽取的方法
- 醫(yī)學(xué)術(shù)語識(shí)別方法及裝置
- 術(shù)語抽取方法和裝置
- 一種醫(yī)療術(shù)語知識(shí)庫完善的方法和裝置
- 一種構(gòu)建制造領(lǐng)域術(shù)語庫的方法及系統(tǒng)
- 術(shù)語更新方法以及相關(guān)設(shè)備、裝置
- 一種醫(yī)學(xué)術(shù)語系統(tǒng)的構(gòu)建方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 一種基于多特征的術(shù)語檢索方法
- 一種術(shù)語替換方法及系統(tǒng)
- 一種標(biāo)準(zhǔn)術(shù)語確定方法、裝置及存儲(chǔ)介質(zhì)
- 一種數(shù)據(jù)庫讀寫分離的方法和裝置
- 一種手機(jī)動(dòng)漫人物及背景創(chuàng)作方法
- 一種通訊綜合測(cè)試終端的測(cè)試方法
- 一種服裝用人體測(cè)量基準(zhǔn)點(diǎn)的獲取方法
- 系統(tǒng)升級(jí)方法及裝置
- 用于虛擬和接口方法調(diào)用的裝置和方法
- 線程狀態(tài)監(jiān)控方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)
- 一種JAVA智能卡及其虛擬機(jī)組件優(yōu)化方法
- 檢測(cè)程序中方法耗時(shí)的方法、裝置及存儲(chǔ)介質(zhì)
- 函數(shù)的執(zhí)行方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)





