[發明專利]一種將excel文件數據導入數據庫的方法及裝置在審
| 申請號: | 201811215909.3 | 申請日: | 2018-10-18 |
| 公開(公告)號: | CN109446257A | 公開(公告)日: | 2019-03-08 |
| 發明(設計)人: | 趙金柱 | 申請(專利權)人: | 浪潮軟件集團有限公司 |
| 主分類號: | G06F16/25 | 分類號: | G06F16/25 |
| 代理公司: | 濟南信達專利事務所有限公司 37100 | 代理人: | 李世喆 |
| 地址: | 250100 山東*** | 國省代碼: | 山東;37 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 表頭 子文件 文件夾 數據庫 映射關系 記錄 文件解析 列數據 分出 | ||
1.一種將excel文件數據導入數據庫的方法,其特征在于,
確定待處理的excel文件,其中,所述excel文件包括至少一個sheet,每一個sheet中均記錄有至少一類表頭,每一類表頭的表頭個數均為至少一個,每一個表頭下均記錄有至少一列數據,不同表頭的表頭內容不同;
確定映射關系,所述映射關系包括:對于所述excel文件包括的全部表頭中的任一第一表頭,所述第一表頭對應有數據庫中的一個數據表,所述第一表頭下的每一列均對應有所述第一表頭對應數據表中的一列;
還包括:
將所述excel文件解析為xml文件;
基于所述xml文件以拆分出至少一個文件夾,其中,不同文件夾對應的表頭類別不同,每一個文件夾中均包括至少一組子文件,每一組子文件中均包括至少一個子文件,不同組子文件對應的表頭不同,每一組子文件均記錄有對應表頭及對應表頭下的全部數據;
根據所述映射關系,將拆分得到的每一組子文件中的數據分別導入到對應數據表中。
2.根據權利要求1所述的方法,其特征在于,
所述基于所述xml文件以拆分出至少一個文件夾,包括:
針對所述xml文件包括的每一個sheet均執行:按照行數自小至大的順序,依次確定當前sheet中的每一個表頭;
根據確定出的每一個表頭的表頭類別,構建每一類表頭所對應的文件夾;
針對確定出的每一個表頭均執行:判斷當前表頭下全部數據的總行數是否不小于預設閾值,若是,在所述當前表頭的表頭類別對應的文件夾下,構建所述當前表頭對應的一組子文件,且對于該組子文件中的任一第一子文件,所述第一子文件中、所述當前表頭下全部數據的總行數不大于所述預設閾值,所述第一子文件中的任一行數據不存在于任一同組的其他子文件中,否則,在所述當前表頭的表頭類別對應的文件夾下,構建所述當前表頭對應的子文件。
3.根據權利要求2所述的方法,其特征在于,
進一步包括:根據公式一,確定所述當前表頭對應的一組子文件中子文件的個數;
所述公式一包括:N=X/x
其中,N為所述當前表頭對應的一組子文件中子文件的個數,且取值方式為向上取整,X為所述當前表頭下全部數據的總行數,x為所述預設閾值。
4.根據權利要求2或3所述的方法,其特征在于,
所述將拆分得到的每一組子文件中的數據分別導入到對應數據表中,包括:采用不同組子文件間多線程導入、同一組子文件間單線程導入的方式,將拆分得到的每一組子文件中的數據分別導入到對應數據表中。
5.一種將excel文件數據導入數據庫的裝置,其特征在于,包括:
第一確定單元,用于確定待處理的excel文件,其中,所述excel文件包括至少一個sheet,每一個sheet中均記錄有至少一類表頭,每一類表頭的表頭個數均為至少一個,每一個表頭下均記錄有至少一列數據,不同表頭的表頭內容不同;
第二確定單元,用于確定映射關系,所述映射關系包括:對于所述excel文件包括的全部表頭中的任一第一表頭,所述第一表頭對應有數據庫中的一個數據表,所述第一表頭下的每一列均對應有所述第一表頭對應數據表中的一列;
解析單元,用于將所述excel文件解析為xml文件;
處理單元,用于基于所述xml文件以拆分出至少一個文件夾,其中,不同文件夾對應的表頭類別不同,每一個文件夾中均包括至少一組子文件,每一組子文件中均包括至少一個子文件,不同組子文件對應的表頭不同,每一組子文件均記錄有對應表頭及對應表頭下的全部數據;
導入單元,用于根據所述映射關系,將拆分得到的每一組子文件中的數據分別導入到對應數據表中。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于浪潮軟件集團有限公司,未經浪潮軟件集團有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811215909.3/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:網絡數據的結構化處理方法和裝置
- 下一篇:一種分布式數據存儲方法及系統





