[發(fā)明專利]指標(biāo)提取的校驗方法及裝置有效
| 申請?zhí)枺?/td> | 201710774876.5 | 申請日: | 2017-08-31 |
| 公開(公告)號: | CN107562725B | 公開(公告)日: | 2020-10-09 |
| 發(fā)明(設(shè)計)人: | 黃曉 | 申請(專利權(quán))人: | 新華三大數(shù)據(jù)技術(shù)有限公司 |
| 主分類號: | G06F40/279 | 分類號: | G06F40/279;G16H70/00 |
| 代理公司: | 北京林達劉知識產(chǎn)權(quán)代理事務(wù)所(普通合伙) 11277 | 代理人: | 劉新宇 |
| 地址: | 450000 河南省鄭州市鄭州高新*** | 國省代碼: | 河南;41 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 指標(biāo) 提取 校驗 方法 裝置 | ||
本公開涉及一種指標(biāo)提取的校驗方法及裝置,包括針對每個電子文本進行指標(biāo)提取,得到該電子文本的第一指標(biāo)和對應(yīng)的第一指標(biāo)值;抽取作為樣本的電子文本;針對每個樣本,采集該樣本的第二指標(biāo)和對應(yīng)的第二指標(biāo)值;以樣本的第二指標(biāo)和第二指標(biāo)值對樣本的第一指標(biāo)和第一指標(biāo)值進行校驗,得到校驗結(jié)果;基于所述校驗結(jié)果評估所述指標(biāo)提取的準(zhǔn)確性,根據(jù)本公開實施例的指標(biāo)提取的校驗方法及裝置能夠?qū)μ崛〉闹笜?biāo)的準(zhǔn)確性進行校驗和可靠的評估。
技術(shù)領(lǐng)域
本公開涉及數(shù)據(jù)處理領(lǐng)域,尤其涉及一種指標(biāo)提取的校驗方法及裝置。
背景技術(shù)
非結(jié)構(gòu)化文本的數(shù)據(jù)提取是一個廣泛研究的問題。舉例來說,醫(yī)療大數(shù)據(jù)中,需要從醫(yī)療非結(jié)構(gòu)化自由文本(例如醫(yī)生書寫的病例)中提取醫(yī)學(xué)指標(biāo),用于數(shù)據(jù)挖掘和分析。醫(yī)生書寫隨意,非結(jié)構(gòu)化電子病歷提取解析的過程復(fù)雜,提取后的指標(biāo)可能出現(xiàn)值遺漏、值錯誤、數(shù)據(jù)總數(shù)不對等問題。提取的指標(biāo)質(zhì)量決定了上層分析質(zhì)量。實際項目中,可以在每次提取后對提取的指標(biāo)進行準(zhǔn)確性校驗,用校驗后的結(jié)果優(yōu)化提取方法。
相關(guān)技術(shù)中可以通過數(shù)據(jù)條數(shù)對比,進行指標(biāo)提取的準(zhǔn)確性校驗,但無法驗證提取出的指標(biāo)的準(zhǔn)確性,例如指標(biāo)提取是否有遺漏,提取的指標(biāo)值與原數(shù)據(jù)是否一致等。
發(fā)明內(nèi)容
有鑒于此,本公開提出了一種指標(biāo)提取的校驗方法及裝置,能夠?qū)碾娮游谋局袑μ崛〉闹笜?biāo)的準(zhǔn)確性進行校驗和可靠的評估。
根據(jù)本公開的一方面,提供了一種指標(biāo)提取的校驗方法,該方法包括:針對每個電子文本進行指標(biāo)提取,得到該電子文本的第一指標(biāo)和對應(yīng)的第一指標(biāo)值;抽取作為樣本的電子文本;針對每個樣本,采集該樣本的第二指標(biāo)和對應(yīng)的第二指標(biāo)值;以樣本的第二指標(biāo)和第二指標(biāo)值對樣本的第一指標(biāo)和第一指標(biāo)值進行校驗,得到校驗結(jié)果;基于所述校驗結(jié)果評估所述指標(biāo)提取的準(zhǔn)確性。
根據(jù)本公開的另一方面,提供了一種指標(biāo)提取的校驗裝置,該裝置包括:提取模塊,用于針對每個電子文本進行指標(biāo)提取,得到該電子文本的第一指標(biāo)和對應(yīng)的第一指標(biāo)值;抽取模塊,用于抽取作為樣本的電子文本;采集模塊,用于針對每個樣本,采集該樣本的第二指標(biāo)和對應(yīng)的第二指標(biāo)值;校驗?zāi)K,用于以樣本的第二指標(biāo)和第二指標(biāo)值對樣本的第一指標(biāo)和第一指標(biāo)值進行校驗,得到校驗結(jié)果;評估模塊,用于基于所述校驗結(jié)果評估所述指標(biāo)提取的準(zhǔn)確性。
通過提取每個電子文本的第一指標(biāo)和對應(yīng)的第一指標(biāo)值;抽取作為樣本的電子文本,并采集每個樣本的第二指標(biāo)和對應(yīng)的第二指標(biāo)值;以樣本的第二指標(biāo)和第二指標(biāo)值對樣本的第一指標(biāo)和第一指標(biāo)值進行校驗,基于校驗結(jié)果評估提取的準(zhǔn)確性,根據(jù)本公開的各方面的指標(biāo)提取的校驗方法及裝置能夠?qū)μ崛〉闹笜?biāo)的準(zhǔn)確性進行校驗和可靠的評估,同時,通過樣本的校驗結(jié)果評估指標(biāo)提取的準(zhǔn)確性,可以減少校驗時間和校驗的工作量。
根據(jù)下面參考附圖對示例性實施例的詳細說明,本公開的其它特征及方面將變得清楚。
附圖說明
包含在說明書中并且構(gòu)成說明書的一部分的附圖與說明書一起示出了本公開的示例性實施例、特征和方面,并且用于解釋本公開的原理。
圖1示出根據(jù)本公開一實施例的指標(biāo)提取的校驗方法的流程圖;
圖2示出根據(jù)本公開一實施例的指標(biāo)提取的校驗方法的流程圖;
圖3示出根據(jù)本公開一實施例的指標(biāo)提取的校驗方法的流程圖;
圖4a示出根據(jù)本公開一個示例的各類型問題數(shù)量的柱狀圖;
圖4b示出根據(jù)本公開一個示例的各類型問題數(shù)量的柱狀圖;
圖4c示出根據(jù)本公開一個示例的各類型問題數(shù)量的柱狀圖;
圖5示出根據(jù)本公開一實施例的指標(biāo)提取的校驗方法的流程圖;
圖6示出根據(jù)本公開一實施例的指標(biāo)提取的校驗裝置的框圖;
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于新華三大數(shù)據(jù)技術(shù)有限公司,未經(jīng)新華三大數(shù)據(jù)技術(shù)有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710774876.5/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 一種網(wǎng)絡(luò)驗證信息的方法和裝置
- 數(shù)據(jù)安全校驗方法、裝置及校驗設(shè)備
- XBRL實例文檔校驗方法以及系統(tǒng)
- 一次性可編程存儲裝置以及對其進行數(shù)據(jù)校驗的方法
- 信息校驗方法及裝置
- 一種基于Java系統(tǒng)的數(shù)據(jù)校驗方法及系統(tǒng)
- 用于獨立冗余磁盤陣列的數(shù)據(jù)管理方法、設(shè)備和計算機程序產(chǎn)品
- 數(shù)據(jù)校驗方法及應(yīng)用系統(tǒng)
- 數(shù)據(jù)校驗方法、裝置、電子設(shè)備
- 一種業(yè)務(wù)數(shù)據(jù)校驗方法及裝置





