[發明專利]一種數據處理方法、裝置、終端設備及存儲介質有效
| 申請號: | 202010115230.8 | 申請日: | 2020-02-25 |
| 公開(公告)號: | CN111309972B | 公開(公告)日: | 2023-06-30 |
| 發明(設計)人: | 劉均;鄧蒙召 | 申請(專利權)人: | 深圳市元征科技股份有限公司 |
| 主分類號: | G06F16/81 | 分類號: | G06F16/81 |
| 代理公司: | 深圳中一聯合知識產權代理有限公司 44414 | 代理人: | 李娟 |
| 地址: | 518000 廣東省深圳市龍*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 數據處理 方法 裝置 終端設備 存儲 介質 | ||
本申請適用于計算機技術領域,提供了一種數據處理方法、裝置、終端設備及存儲介質,所述數據處理方法包括:獲取以預設格式存儲的源數據;解析所述源數據,確定所述源數據包含的各個父標簽對應的數據類別;根據各個所述父標簽對應的數據類別和各個所述父標簽各自對應的子標簽對應的數據子類別,構建數據類別與數據子類別之間的鍵值對;基于所述數據類別與數據子類別之間的鍵值對,確定目標數據類別,所述目標數據類別包括具有相互包含關系的所述數據類別和所述數據子類別。通過上述方法能夠高效篩選出具有相互包含關系的數據類別。
技術領域
本申請屬于計算機技術領域,尤其涉及一種數據處理方法、裝置、終端設備及存儲介質。
背景技術
目前,常見的開源數據通常以預設格式進行存儲,例如汽車廠家提供的基于開放的診斷交互格式標準的可擴展標記語言(XML)格式存儲的車源數據。由于預設格式的車源數據通常以數據類別定義標簽,導致不同數據類別之間的車源數據可能存在相互包含關系。而現有技術中,很難高效篩選出具有相互包含關系的數據類別,影響數據使用的完整性和準確性。因此,如何快速高效地篩選出具有相互包含關系的數據類別是亟待解決的技術問題。
發明內容
本申請的目的在于提供一種數據處理方法、裝置、終端設備及存儲介質,旨在解決現有技術中很難高效篩選出具有相互包含關系的數據類別的問題。
本申請實施例的第一方面提了一種數據處理方法,包括:
獲取以預設格式存儲的源數據;
解析所述源數據,確定所述源數據包含的各個父標簽對應的數據類別;
根據各個所述父標簽對應的數據類別和各個所述父標簽各自對應的子標簽對應的數據子類別,構建數據類別與數據子類別之間的鍵值對;
基于所述數據類別與數據子類別之間的鍵值對,確定目標數據類別,所述目標數據類別包括具有相互包含關系的所述數據類別和所述數據子類別。
在一種可選的實現方式中,所述獲取以預設格式存儲的源數據,包括:
獲取以可擴展標記語言格式存儲的源數據,所述源數據包括不同的預設可擴展標記語言標簽,各個所述預設可擴展標記語言標簽與各個所述父標簽相互對應,且各個所述預設可擴展標記語言標簽對應所述源數據的不同數據類別。
在一種可選的實現方式中,所述解析所述源數據,確定所述源數據中各個父標簽對應的數據類別,包括:
解析所述源數據,分別獲取所述源數據包含的所有所述預設可擴展標記語言標簽對應的所述數據類別,其中,各個所述預設可擴展標記語言標簽對應的所述數據類別分別為各個所述父標簽對應的數據類別。
在一種可選的實現方式中,在所述根據各個所述父標簽對應的數據類別和各個所述父標簽各自對應的子標簽對應的數據子類別,構建數據類別與數據子類別之間的鍵值對之后,包括:
將所述鍵值對存儲至預先生成的第一關聯容器;其中,以各個所述父標簽作為所述第一關聯容器中的第一對象,以各個所述父標簽各自對應的子標簽作為各個所述第一對象的子對象,將各個所述第一對象對應的所述數據類別和各個所述第一對象的子對象對應的數據子類別關系存儲至所述第一關聯容器。
在一種可選的實現方式中,所述基于所述數據類別與數據子類別之間的鍵值對,確定目標數據類別,包括:
調用預設的遞歸函數遍歷所述第一關聯容器,從所述第一關聯容器中獲取所述目標數據類別。
在一種可選的實現方式中,所述調用預設的遞歸函數遍歷所述第一關聯容器,從所述第一關聯容器中獲取所述目標數據類別,包括:
通過所述遞歸函數的第一層循環,遍歷所述第一關聯容器中的所有第一對象;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于深圳市元征科技股份有限公司,未經深圳市元征科技股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010115230.8/2.html,轉載請聲明來源鉆瓜專利網。





