[發明專利]一種文本數據單位處理方法、裝置及設備在審
| 申請號: | 202211536443.3 | 申請日: | 2022-12-02 |
| 公開(公告)號: | CN115994218A | 公開(公告)日: | 2023-04-21 |
| 發明(設計)人: | 甘偉;曲振忠;陳聯忠;牛明芳 | 申請(專利權)人: | 北京嘉和海森健康科技有限公司 |
| 主分類號: | G06F16/35 | 分類號: | G06F16/35;G06F40/157;G06F40/289 |
| 代理公司: | 北京集佳知識產權代理有限公司 11227 | 代理人: | 李金 |
| 地址: | 100085 北京市海淀區上*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 文本 數據 單位 處理 方法 裝置 設備 | ||
本申請公開了一種文本數據單位處理方法、裝置及設備,通過獲取預先定義的標準單位、單位轉換系數和單位轉換公式,從待處理文本中提取實體對,并確定實體對類別,獲取與預先定義數據元的名稱對應的類別的實體對,若實體對包含數據和計量單位,則提取數據和計量單位為初始數據和初始單位,基于單位轉換系數和單位轉換公式將初始數據和初始單位轉換為標準數據和標準單位,將標準數據存儲到預先定義的數據元,得到標準數據元,將標準數據元通過預先配置的表單展示。因此,標準單位發生變化時,本申請只需要獲取新定義的標準單位、單位轉換系數和單位轉換公式就可以完成單位之間的轉換,不需要程序人員對程序進行更改,單位之間轉換更加靈活。
技術領域
本申請涉及數據處理技術領域,更具體地說,涉及一種文本數據單位處理方法、裝置及設備。
背景技術
隨著科技和經濟的發展,各行各業中產生的數據也越來越多,大部分數據以文本形式記載,不同人數據記錄習慣會有不同,因此數據記錄的形式也會有所不同。為了可以更好的對數據進行分析,在對數據進行分析前,需要對數據進行處理。如:醫生在書寫病歷時,由于個人習慣的不同,對于病人吸煙史的記錄可能是:“吸煙半年,平均半包/天”、“吸煙3月,平均2支/天”等方式,若需要對患者吸煙史的數據進行分析,就需要統一記錄的單位。
現有技術中,當數據單位不一致時,根據初始的數據單位和標準單位,程序人員定制性開發程序來完成數據單位的轉換,但是,當標準單位需要隨著場景的變化而變化時,需要程序人員對程序進行同步更改,單位之間的轉換的靈活性較差。
發明內容
有鑒于此,本申請提供了一種文本數據單位處理方法、裝置及設備,用于解決現有技術中,當標準單位需要變化時,需要程序人員對程序進行更改,單位轉換靈活性較差的問題。
為實現上述目的,先提出的方案如下:
一種文本數據單位處理方法,包括:
獲取待處理文本;
獲取預先定義的標準單位、單位轉換系數和單位轉換公式,所述單位轉換系數為表達初始單位和標準單位之間的關系的數值,所述單位轉換公式為所述初始單位轉換為所述標準單位時的計算公式;
從所述待處理文本中提取實體對,并確定實體對的類別,所述實體對為具有實體關系的兩個實體進行結合得到;
獲取與預先定義的數據元的名稱所對應的類別的實體對,所述數據元為預先根據待處理文本內容所定義的數據字段;
判斷所述實體對是否包含數據和計量單位;
若所述實體對包含數據和計量單位,則提取所述實體對中的數據和計量單位,得到初始數據和初始單位;
基于所述單位轉換系數和轉換公式將所述初始數據和所述初始單位轉換為標準數據和標準單位,所述標準數據是以所述標準單位作為記錄單位的所記錄的數據;
將標準數據存儲到所述預先定義的數據元中,得到存儲有標準數據的標準數據元;
將所述標準數據元通過預先配置的表單進行展示。
優選地,基于所述單位轉換系數和轉換公式將所述初始數據和所述初始單位轉換為標準數據和標準單位之前,還包括:
判斷所述初始數據是否為數值型數據;
若所述初始數據不是數值型數據,則按照預設的轉換規則將所述初始數據轉換為數值型數據。
優選地,基于所述單位轉換系數和轉換公式將所述初始數據和所述初始單位轉換為標準數據和標準單位之前,還包括:
判斷所述初始單位是否與所述標準單位一致;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京嘉和海森健康科技有限公司,未經北京嘉和海森健康科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202211536443.3/2.html,轉載請聲明來源鉆瓜專利網。
- 數據顯示系統、數據中繼設備、數據中繼方法、數據系統、接收設備和數據讀取方法
- 數據記錄方法、數據記錄裝置、數據記錄媒體、數據重播方法和數據重播裝置
- 數據發送方法、數據發送系統、數據發送裝置以及數據結構
- 數據顯示系統、數據中繼設備、數據中繼方法及數據系統
- 數據嵌入裝置、數據嵌入方法、數據提取裝置及數據提取方法
- 數據管理裝置、數據編輯裝置、數據閱覽裝置、數據管理方法、數據編輯方法以及數據閱覽方法
- 數據發送和數據接收設備、數據發送和數據接收方法
- 數據發送裝置、數據接收裝置、數據收發系統、數據發送方法、數據接收方法和數據收發方法
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置





