[發(fā)明專利]醫(yī)學(xué)名稱歸一化方法、裝置、存儲介質(zhì)及終端有效
| 申請?zhí)枺?/td> | 202010633727.9 | 申請日: | 2020-07-02 |
| 公開(公告)號: | CN111859942B | 公開(公告)日: | 2021-07-13 |
| 發(fā)明(設(shè)計)人: | 薛顏波;顧根;劉霄晨 | 申請(專利權(quán))人: | 上海森億醫(yī)療科技有限公司 |
| 主分類號: | G06F40/284 | 分類號: | G06F40/284;G06F16/31;G06F16/332 |
| 代理公司: | 上海光華專利事務(wù)所(普通合伙) 31219 | 代理人: | 倪靜 |
| 地址: | 201213 上海市浦*** | 國省代碼: | 上海;31 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 醫(yī)學(xué) 名稱 歸一化 方法 裝置 存儲 介質(zhì) 終端 | ||
本發(fā)明提供一種醫(yī)學(xué)名稱歸一化方法、裝置、存儲介質(zhì)及終端。所述醫(yī)學(xué)名稱歸一化方法包括:對醫(yī)學(xué)標(biāo)準(zhǔn)詞表中的每個標(biāo)準(zhǔn)詞條進行第一階段的拆解,得到每個標(biāo)準(zhǔn)詞條所對應(yīng)的多個醫(yī)學(xué)屬性;為每個標(biāo)準(zhǔn)詞條構(gòu)建相應(yīng)的屬性表達式;對所述每個標(biāo)準(zhǔn)詞條進行第二階段拆解,得到每個醫(yī)學(xué)屬性下的多個子屬性;獲取待歸一的醫(yī)學(xué)名稱所對應(yīng)的多個醫(yī)學(xué)屬性及每個醫(yī)學(xué)屬性下的多個子屬性;將所述待歸一的醫(yī)學(xué)名稱的多個子屬性與標(biāo)準(zhǔn)詞條的多個子屬性進行表達式匹配計算;輸出符合匹配要求的所述待歸一的醫(yī)學(xué)名稱所對應(yīng)的標(biāo)準(zhǔn)詞條。本發(fā)明適用于復(fù)雜應(yīng)用場景,極大降低了醫(yī)學(xué)名稱歸一化的人力成本,提高了醫(yī)學(xué)名稱歸一化的效率與準(zhǔn)確率。
技術(shù)領(lǐng)域
本發(fā)明涉及醫(yī)學(xué)信息處理領(lǐng)域,特別是涉及醫(yī)學(xué)名稱歸一化方法、裝置、存儲介質(zhì)及終端。
背景技術(shù)
醫(yī)療行業(yè)是數(shù)據(jù)密集型的行業(yè),該行業(yè)無論是公共衛(wèi)生、臨床服務(wù)還是醫(yī)學(xué)研究,都離不開數(shù)據(jù)的支撐。在醫(yī)療大數(shù)據(jù)平臺建設(shè)過程中,需要對海量的醫(yī)療數(shù)據(jù)進行標(biāo)準(zhǔn)化處理,才能充分利用數(shù)據(jù)價值。但是,目前我國的醫(yī)療數(shù)據(jù)缺乏統(tǒng)一的標(biāo)準(zhǔn)規(guī)范,各個地區(qū)甚至各個醫(yī)院都未使用統(tǒng)一的數(shù)據(jù)標(biāo)準(zhǔn),嚴(yán)重影響了醫(yī)療大數(shù)據(jù)平臺的數(shù)據(jù)質(zhì)量和數(shù)據(jù)治理效果。
我國不同地區(qū)甚至不同醫(yī)院對于同一檢查指標(biāo)均存在不同的檢驗名稱,僅以“血清鈉”為例,就包括“鈉離子濃度”、“NA+”、“動脈血鈉”和“血鈉(Na)”等十多種不同的名稱。為解決上述醫(yī)學(xué)檢驗名稱差異帶來的醫(yī)療數(shù)據(jù)治理難度大、數(shù)據(jù)質(zhì)量低的問題,現(xiàn)階段的基本方法是收集每種檢驗名稱的同義詞,通過建立同義詞詞表進行映射。但是,這種方法僅適用于簡單場景,當(dāng)外部輸入檢驗文本稍微復(fù)雜時就會失效。例如,外部輸入檢驗文本中若包含檢驗名稱和樣本來源或者其他信息字段時,某個檢驗名稱為“α1微球蛋白/24h”,額外單位信息為“mg/24h”,需要獲得準(zhǔn)確詞條“尿24小時微量白蛋白含量測定(24小時微量白蛋白)”,如果僅依靠同義詞匹配,只能獲得“尿微量白蛋白定量”這個詞條。因此,上述方法得出的結(jié)果無法滿足實際應(yīng)用場景。
除上述同義詞詞表的方法之外,還可以采取的方法有:建立標(biāo)準(zhǔn)詞表,并預(yù)先定義標(biāo)準(zhǔn)詞條的主屬性和次要屬性類別(類別數(shù)量確定,類別舉例如下:“主診斷詞”、“主解剖部位”、“次解剖部位”、“分型”、“病理”等),當(dāng)外部輸入檢驗文本全部滿足主屬性和所有次要屬性類別條件時輸出正確答案。這種方法的缺點如下:1)預(yù)先為標(biāo)準(zhǔn)詞條定義固定數(shù)量的屬性,當(dāng)遇到復(fù)雜標(biāo)準(zhǔn)詞條,原有屬性數(shù)量不夠用時,無法正確定義并準(zhǔn)確輸出該標(biāo)準(zhǔn)詞條,會影響最終歸一化效果2)判斷標(biāo)準(zhǔn)詞條的方法過于單一,僅考慮同時滿足主屬性和所有次要屬性的包含條件,未考慮到各種屬性之間的相關(guān)性、互斥性、順序性等各種組合情況以及權(quán)重分配問題,不夠靈活和通用。
因此,亟需提出一種適用于復(fù)雜場景的具有更高的靈活性和通用性的醫(yī)學(xué)名稱歸一化方法,以提高醫(yī)學(xué)大數(shù)據(jù)平臺的數(shù)據(jù)質(zhì)量和數(shù)據(jù)治理效果。
發(fā)明內(nèi)容
鑒于以上所述現(xiàn)有技術(shù)的缺點,本發(fā)明的目的在于提供醫(yī)學(xué)名稱歸一化方法、裝置、存儲介質(zhì)及終端,用于解決現(xiàn)有技術(shù)中的醫(yī)學(xué)名稱歸一化方法靈活性和通用性不夠高,無法滿足實際應(yīng)用需要的問題。
為實現(xiàn)上述目的及其他相關(guān)目的,本發(fā)明的第一方面提供一種醫(yī)學(xué)名稱歸一化方法,包括:對醫(yī)學(xué)標(biāo)準(zhǔn)詞表中的每個標(biāo)準(zhǔn)詞條進行第一階段的拆解,以拆解得到每個標(biāo)準(zhǔn)詞條所對應(yīng)的多個醫(yī)學(xué)屬性;根據(jù)每個標(biāo)準(zhǔn)詞條所對應(yīng)的多個醫(yī)學(xué)屬性,為每個標(biāo)準(zhǔn)詞條構(gòu)建相應(yīng)的屬性表達式;對所述每個標(biāo)準(zhǔn)詞條進行第二階段拆解,以拆解得到每個醫(yī)學(xué)屬性下的多個子屬性;獲取待歸一的醫(yī)學(xué)名稱所對應(yīng)的多個醫(yī)學(xué)屬性及每個醫(yī)學(xué)屬性下的多個子屬性;將所述待歸一的醫(yī)學(xué)名稱的多個子屬性與標(biāo)準(zhǔn)詞條的多個子屬性進行表達式匹配計算;根據(jù)計算結(jié)果,輸出符合匹配要求的所述待歸一的醫(yī)學(xué)名稱所對應(yīng)的標(biāo)準(zhǔn)詞條。
于本發(fā)明的第一方面的一些實施例中,所述方法還包括:當(dāng)所述待歸一的醫(yī)學(xué)名稱所對應(yīng)的標(biāo)準(zhǔn)詞條不唯一時,對所述標(biāo)準(zhǔn)詞條進行過濾和篩選,以獲取待歸一的醫(yī)學(xué)名稱所對應(yīng)的唯一標(biāo)準(zhǔn)詞條。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于上海森億醫(yī)療科技有限公司,未經(jīng)上海森億醫(yī)療科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010633727.9/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 將醫(yī)學(xué)設(shè)備自動整合到醫(yī)學(xué)設(shè)施網(wǎng)絡(luò)的方法和設(shè)備
- 醫(yī)學(xué)詢問細化系統(tǒng)、方法、裝置及包括醫(yī)學(xué)詢問系統(tǒng)的工作站
- 將醫(yī)學(xué)設(shè)備自動整合到醫(yī)學(xué)設(shè)施網(wǎng)絡(luò)的方法和設(shè)備
- 基于人工智能的醫(yī)學(xué)影像分類處理系統(tǒng)及方法
- 一種醫(yī)學(xué)圖像系統(tǒng)
- 醫(yī)學(xué)知識圖譜構(gòu)建方法及裝置、存儲介質(zhì)和電子設(shè)備
- 一種實現(xiàn)醫(yī)學(xué)編碼映射的方法、裝置及設(shè)備
- 醫(yī)學(xué)影像的分類方法、醫(yī)學(xué)影像的檢索方法和裝置
- 一種醫(yī)學(xué)圖像處理方法、醫(yī)學(xué)圖像識別方法及裝置
- 醫(yī)學(xué)圖像標(biāo)記方法、裝置、設(shè)備及存儲介質(zhì)





