[發明專利]一種數據處理方法及裝置在審
| 申請號: | 202010434552.9 | 申請日: | 2020-05-21 |
| 公開(公告)號: | CN113704559A | 公開(公告)日: | 2021-11-26 |
| 發明(設計)人: | 李長亮;樊駿鋒;汪美玲 | 申請(專利權)人: | 北京金山數字娛樂科技有限公司 |
| 主分類號: | G06F16/901 | 分類號: | G06F16/901;G06F16/25 |
| 代理公司: | 北京柏杉松知識產權代理事務所(普通合伙) 11413 | 代理人: | 孟維娜;項京 |
| 地址: | 100085 北京市海淀*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 數據處理 方法 裝置 | ||
本發明實施例提供了一種數據處理方法及裝置,上述方法包括:獲得待處理的結構化數據;以結構化數據的標識為節點標識、且以結構化數據包含的字段值為節點屬性,生成每一結構化數據所對應節點的節點數據;根據預設的關系字段信息,生成各個結構化數據所對應節點間的關系數據,其中,所述預設的關系字段信息包括:結構化數據中存在關系的字段值以及存在關系的字段值間的關系信息;獲得包含節點數據以及關系數據的文件,并將文件導入至圖數據庫中。應用本發明實施例提供的方案進行數據處理時,提高了數據處理的效率。
技術領域
本發明涉及計算機技術領域,特別是涉及一種數據處理方法及裝置。
背景技術
圖數據庫是一種存儲關系型數據的數據庫。圖數據庫中存儲的關系型數據包括:各個節點的節點數據以及表示各個節點間關系的關系數據。由于圖數據庫存儲了各個節點間關系的關系數據,在圖數據庫中查詢節點的節點數據的效率較高。另外,在實際應用中常常會涉及對結構化數據的查詢,因此,可以將上述結構化數據導入至圖數據庫中,這樣可以基于圖數據庫實現對結構化數據的查詢,從而提高上述結構化數據的查詢效率。
由于關系型數據是非結構化數據,因此,難以直接將結構化數據導入圖數據庫中。現有技術中,在將結構化數據導入至圖數據庫中時,工作人員手動生成結構化數據的文件,電子設備通過調用圖數據庫的導入接口將文件導入至圖數據庫中。然而,由于是由工作人員手動生成文件的,當結構化數據的數據量巨大時,生成文件的工作量加大、效率較低,從而使得數據導入的效率較低,降低了數據處理效率。
發明內容
本發明實施例的目的在于提供一種數據處理方法及裝置,以提高數據處理效率。具體技術方案如下:
第一方面,本發明實施例提供了一種數據處理方法,上述方法包括:
獲得待處理的結構化數據;
以所述結構化數據的標識為節點標識、且以所述結構化數據包含的字段值為節點屬性,生成每一結構化數據所對應節點的節點數據;
根據預設的關系字段信息,生成各個結構化數據所對應節點間的關系數據,其中,所述預設的關系字段信息包括:所述結構化數據中存在關系的字段值、以及存在關系的字段值間的關系信息;
獲得包含所述節點數據以及所述關系數據的文件,并將所述文件導入至圖數據庫中。
本發明的一個實施例中,上述根據預設的關系字段信息,生成各個結構化數據所對應節點間的關系數據,包括:
確定所述節點屬性中包括預設的關系字段信息中的所述字段值的節點;
根據所述預設的關系字段信息中的所述關系信息,生成所確定節點間的關系數據。
本發明的一個實施例中,上述獲得待處理的結構化數據,包括:
從預設的數據源中獲得結構化數據,對所獲得的結構化數據進行數據清洗;
基于預設的標識映射關系,將清洗后的結構化數據中字段值對應的字段標識映射為節點屬性對應的屬性標識,將映射標識后的結構化數據作為待處理的結構化數據。
本發明的一個實施例中,上述將映射標識后的結構化數據作為待處理的結構化數據,包括:
按照預設的字段值格式,對映射標識后的結構化數據中的字段值進行格式調整,將調整后的結構化數據作為待處理的結構化數據。
本發明的一個實施例中,上述獲得包含所述節點數據以及所述關系數據的文件,包括:
按照預設的文件格式需求,生成包含所述節點數據以及所述關系數據的文件,并按照預設的文件存儲需求,存儲所述文件。
第二方面,本發明實施例提供了一種數據處理裝置,上述裝置包括:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京金山數字娛樂科技有限公司,未經北京金山數字娛樂科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010434552.9/2.html,轉載請聲明來源鉆瓜專利網。





