[發明專利]一種將excel文件數據導入數據庫的方法及裝置在審
| 申請號: | 201811215909.3 | 申請日: | 2018-10-18 |
| 公開(公告)號: | CN109446257A | 公開(公告)日: | 2019-03-08 |
| 發明(設計)人: | 趙金柱 | 申請(專利權)人: | 浪潮軟件集團有限公司 |
| 主分類號: | G06F16/25 | 分類號: | G06F16/25 |
| 代理公司: | 濟南信達專利事務所有限公司 37100 | 代理人: | 李世喆 |
| 地址: | 250100 山東*** | 國省代碼: | 山東;37 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 表頭 子文件 文件夾 數據庫 映射關系 記錄 文件解析 列數據 分出 | ||
本發明提供了一種將excel文件數據導入數據庫的方法及裝置。確定各sheet中記錄有若干類表頭的excel文件,各類表頭的表頭個數不小于1,各表頭下記錄有若干列數據,不同表頭的表頭內容不同;確定映射關系包括:該文件的任一表頭對應有數據庫中一數據表,該表頭下的每一列對應有相應數據表中的一列;將該文件解析為xml文件并基于此拆分出若干文件夾,不同文件夾對應的表頭類別不同,各文件夾中包括若干組子文件,各組子文件中包括若干子文件,不同組子文件對應的表頭不同,各組子文件記錄有對應表頭及其下的全部數據;根據映射關系將各組子文件中的數據導入到對應數據表中。故可實現數據從excel文件至數據庫的自動導入。
技術領域
本發明涉及計算機技術領域,特別涉及一種將excel文件數據導入數據庫的方法及裝置。
背景技術
眾所周知,excel是一種常見的文件存儲方式,數據庫這一存儲方式也應用普遍,因此將excel文件中的數據導入到數據庫中是數據處理和數據采集不可避免的。
目前,一個excel文件中可以包括多個表頭,當不同表頭下數據需要導入數據庫的不同數據表中時,往往需要工作人員人為按需導入。
但是,這一人為導入方式浪費人力物力。
發明內容
本發明提供了一種將excel文件數據導入數據庫的方法及裝置,能夠實現數據從excel文件至數據庫的自動導入。
為了達到上述目的,本發明是通過如下技術方案實現的:
第一方面,本發明提供了一種將excel文件數據導入數據庫的方法,
確定待處理的excel文件,其中,所述excel文件包括至少一個sheet,每一個sheet中均記錄有至少一類表頭,每一類表頭的表頭個數均為至少一個,每一個表頭下均記錄有至少一列數據,不同表頭的表頭內容不同;
確定映射關系,所述映射關系包括:對于所述excel文件包括的全部表頭中的任一第一表頭,所述第一表頭對應有數據庫中的一個數據表,所述第一表頭下的每一列均對應有所述第一表頭對應數據表中的一列;
還包括:
將所述excel文件解析為xml文件;
基于所述xml文件以拆分出至少一個文件夾,其中,不同文件夾對應的表頭類別不同,每一個文件夾中均包括至少一組子文件,每一組子文件中均包括至少一個子文件,不同組子文件對應的表頭不同,每一組子文件均記錄有對應表頭及對應表頭下的全部數據;
根據所述映射關系,將拆分得到的每一組子文件中的數據分別導入到對應數據表中。
進一步地,所述基于所述xml文件以拆分出至少一個文件夾,包括:
針對所述xml文件包括的每一個sheet均執行:按照行數自小至大的順序,依次確定當前sheet中的每一個表頭;
根據確定出的每一個表頭的表頭類別,構建每一類表頭所對應的文件夾;
針對確定出的每一個表頭均執行:判斷當前表頭下全部數據的總行數是否不小于預設閾值,若是,在所述當前表頭的表頭類別對應的文件夾下,構建所述當前表頭對應的一組子文件,且對于該組子文件中的任一第一子文件,所述第一子文件中、所述當前表頭下全部數據的總行數不大于所述預設閾值,所述第一子文件中的任一行數據不存在于任一同組的其他子文件中,否則,在所述當前表頭的表頭類別對應的文件夾下,構建所述當前表頭對應的子文件。
進一步地,該方法還包括:根據公式一,確定所述當前表頭對應的一組子文件中子文件的個數;
所述公式一包括:N=X/x
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于浪潮軟件集團有限公司,未經浪潮軟件集團有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811215909.3/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:網絡數據的結構化處理方法和裝置
- 下一篇:一種分布式數據存儲方法及系統





