[發(fā)明專利]數(shù)據(jù)映射方法、醫(yī)學文本數(shù)據(jù)映射方法、裝置及電子設備有效
| 申請?zhí)枺?/td> | 202110398287.8 | 申請日: | 2021-04-14 |
| 公開(公告)號: | CN112800187B | 公開(公告)日: | 2021-06-29 |
| 發(fā)明(設計)人: | 王東風;方杰;汪知滴;周月;紀萍 | 申請(專利權)人: | 北京金山云網(wǎng)絡技術有限公司 |
| 主分類號: | G06F16/33 | 分類號: | G06F16/33;G06F40/289;G16H50/70 |
| 代理公司: | 北京柏杉松知識產(chǎn)權代理事務所(普通合伙) 11413 | 代理人: | 孫翠賢;高鶯然 |
| 地址: | 100085 北京市海淀*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 數(shù)據(jù) 映射 方法 醫(yī)學 文本 裝置 電子設備 | ||
本發(fā)明實施例提供了一種數(shù)據(jù)映射方法、醫(yī)學文本數(shù)據(jù)映射方法、裝置及電子設備,涉及人工智能技術領域和醫(yī)療領域。該數(shù)據(jù)映射方法包括:獲取目標文本數(shù)據(jù)的多個分詞;目標文本數(shù)據(jù)包含多個指定字段下的數(shù)據(jù)內(nèi)容;針對每一分詞,基于多個指定字段的標準化數(shù)據(jù)庫,確定與該分詞相匹配的標準詞以及確定該分詞所屬的指定字段;該分詞所屬的指定字段為與該分詞相匹配的標準詞所屬的指定字段;針對每個分詞,根據(jù)與該分詞相匹配的標準詞和該分詞所屬的指定字段,建立關于該分詞的數(shù)據(jù)映射關系。與現(xiàn)有技術相比,應用本發(fā)明實施例提供的方法,可以實現(xiàn)對不同的信息系統(tǒng)的文本數(shù)據(jù)的分詞結(jié)果進行標準化的數(shù)據(jù)映射,為文本數(shù)據(jù)的標準化提供實現(xiàn)基礎。
技術領域
本發(fā)明涉及人工智能技術領域和醫(yī)療領域,特別是涉及一種數(shù)據(jù)映射方法、醫(yī)學文本數(shù)據(jù)映射方法、裝置及電子設備。
背景技術
當前,隨著信息技術的不斷發(fā)展,各行業(yè)內(nèi)部之間的信息交流需求越來越多。但是,現(xiàn)如今,在同一行業(yè)內(nèi),或者,同一機構內(nèi),若干信息系統(tǒng)呈現(xiàn)“信息孤島”的局面。
針對信息系統(tǒng)所形成的文本數(shù)據(jù)而言,由于各個信息系統(tǒng)所采用的數(shù)據(jù)操作規(guī)范不統(tǒng)一,因此,無法得到關于文本數(shù)據(jù)的規(guī)范化的標準化數(shù)據(jù),這無疑會影響各信息系統(tǒng)間的互操作能力以及對于行業(yè)規(guī)范化和整體效率的提升。
以醫(yī)療領域為例,各醫(yī)療機構IT系統(tǒng)眾多,雖然在醫(yī)學影像文本數(shù)據(jù)的數(shù)據(jù)字段層面進行了標準化統(tǒng)一,但各醫(yī)療機構IT系統(tǒng)所采用的數(shù)據(jù)處理規(guī)范不統(tǒng)一,從而,無法進行醫(yī)療質(zhì)量的精細化監(jiān)管分析。
在對不同的信息系統(tǒng)的文本數(shù)據(jù)進行規(guī)范化操作,得到關于文本數(shù)據(jù)的規(guī)范化的標準化數(shù)據(jù)時,需要對文本數(shù)據(jù)的分詞結(jié)果進行標準化的數(shù)據(jù)映射,以確定所得到的每個分詞的標準化數(shù)據(jù),從而,根據(jù)所得到的每個分詞的標準化數(shù)據(jù),得到文本數(shù)據(jù)的標準化數(shù)據(jù)。也就是說,對文本數(shù)據(jù)的分詞結(jié)果進行標準化的數(shù)據(jù)映射,是實現(xiàn)文本數(shù)據(jù)標準化的基礎。
基于此,現(xiàn)在亟需一種數(shù)據(jù)映射方法,對不同的信息系統(tǒng)的文本數(shù)據(jù)的分詞結(jié)果進行標準化的數(shù)據(jù)映射,為文本數(shù)據(jù)的標準化提供實現(xiàn)基礎。
發(fā)明內(nèi)容
本發(fā)明實施例的目的在于提供一種數(shù)據(jù)映射方法、裝置及電子設備,以實現(xiàn)對不同的信息系統(tǒng)的文本數(shù)據(jù)的分詞結(jié)果進行標準化的數(shù)據(jù)映射,為文本數(shù)據(jù)的標準化提供實現(xiàn)基礎。另外,本發(fā)明實施例還提供了一種醫(yī)學文本數(shù)據(jù)映射方法、裝置及電子設備,以對不同的信息系統(tǒng)的醫(yī)學文本數(shù)據(jù)的分詞結(jié)果進行標準化的數(shù)據(jù)映射,為醫(yī)學文本數(shù)據(jù)的標準化提供實現(xiàn)基礎。具體技術方案如下:
第一方面,本發(fā)明實施例提供了一種數(shù)據(jù)映射方法,所述方法包括:
獲取目標文本數(shù)據(jù)的多個分詞;其中,所述目標文本數(shù)據(jù)包含多個指定字段下的數(shù)據(jù)內(nèi)容,所述多個指定字段為:預設有標準化數(shù)據(jù)庫的字段;
針對每一分詞,基于所述多個指定字段的標準化數(shù)據(jù)庫,確定與該分詞相匹配的標準詞,以及確定該分詞所屬的指定字段;其中,該分詞所屬的指定字段為:與該分詞相匹配的標準詞所屬的指定字段;
針對每個分詞,根據(jù)與該分詞相匹配的標準詞和該分詞所屬的指定字段,建立關于該分詞的數(shù)據(jù)映射關系。
第二方面,本發(fā)明實施例提供了一種數(shù)據(jù)映射裝置,所述裝置包括:
分詞獲取模塊,用于獲取目標文本數(shù)據(jù)的多個分詞;其中,所述目標文本數(shù)據(jù)包含多個指定字段下的數(shù)據(jù)內(nèi)容,所述多個指定字段為:預設有標準化數(shù)據(jù)庫的字段;
分詞確定模塊,用于針對每一分詞,基于所述多個指定字段的標準化數(shù)據(jù)庫,確定與該分詞相匹配的標準詞,以及確定該分詞所屬的指定字段;其中,該分詞所屬的指定字段為:與該分詞相匹配的標準詞所屬的指定字段;
關系建立模塊,用于針對每個分詞,根據(jù)與該分詞相匹配的標準詞和該分詞所屬的指定字段,建立關于該分詞的數(shù)據(jù)映射關系。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京金山云網(wǎng)絡技術有限公司,未經(jīng)北京金山云網(wǎng)絡技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110398287.8/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 數(shù)據(jù)顯示系統(tǒng)、數(shù)據(jù)中繼設備、數(shù)據(jù)中繼方法、數(shù)據(jù)系統(tǒng)、接收設備和數(shù)據(jù)讀取方法
- 數(shù)據(jù)記錄方法、數(shù)據(jù)記錄裝置、數(shù)據(jù)記錄媒體、數(shù)據(jù)重播方法和數(shù)據(jù)重播裝置
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)發(fā)送系統(tǒng)、數(shù)據(jù)發(fā)送裝置以及數(shù)據(jù)結(jié)構
- 數(shù)據(jù)顯示系統(tǒng)、數(shù)據(jù)中繼設備、數(shù)據(jù)中繼方法及數(shù)據(jù)系統(tǒng)
- 數(shù)據(jù)嵌入裝置、數(shù)據(jù)嵌入方法、數(shù)據(jù)提取裝置及數(shù)據(jù)提取方法
- 數(shù)據(jù)管理裝置、數(shù)據(jù)編輯裝置、數(shù)據(jù)閱覽裝置、數(shù)據(jù)管理方法、數(shù)據(jù)編輯方法以及數(shù)據(jù)閱覽方法
- 數(shù)據(jù)發(fā)送和數(shù)據(jù)接收設備、數(shù)據(jù)發(fā)送和數(shù)據(jù)接收方法
- 數(shù)據(jù)發(fā)送裝置、數(shù)據(jù)接收裝置、數(shù)據(jù)收發(fā)系統(tǒng)、數(shù)據(jù)發(fā)送方法、數(shù)據(jù)接收方法和數(shù)據(jù)收發(fā)方法
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)再現(xiàn)方法、數(shù)據(jù)發(fā)送裝置及數(shù)據(jù)再現(xiàn)裝置
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)再現(xiàn)方法、數(shù)據(jù)發(fā)送裝置及數(shù)據(jù)再現(xiàn)裝置
- 將醫(yī)學設備自動整合到醫(yī)學設施網(wǎng)絡的方法和設備
- 醫(yī)學詢問細化系統(tǒng)、方法、裝置及包括醫(yī)學詢問系統(tǒng)的工作站
- 將醫(yī)學設備自動整合到醫(yī)學設施網(wǎng)絡的方法和設備
- 基于人工智能的醫(yī)學影像分類處理系統(tǒng)及方法
- 一種醫(yī)學圖像系統(tǒng)
- 醫(yī)學知識圖譜構建方法及裝置、存儲介質(zhì)和電子設備
- 一種實現(xiàn)醫(yī)學編碼映射的方法、裝置及設備
- 醫(yī)學影像的分類方法、醫(yī)學影像的檢索方法和裝置
- 一種醫(yī)學圖像處理方法、醫(yī)學圖像識別方法及裝置
- 醫(yī)學圖像標記方法、裝置、設備及存儲介質(zhì)





