[發明專利]一種數據庫表結構分析方法和系統在審
| 申請號: | 201711396232.3 | 申請日: | 2017-12-21 |
| 公開(公告)號: | CN108108441A | 公開(公告)日: | 2018-06-01 |
| 發明(設計)人: | 呂軍震;劉杰;胥洪鋒;于國方;李長松;武佳 | 申請(專利權)人: | 新博卓暢技術(北京)有限公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 北京馳納智財知識產權代理事務所(普通合伙) 11367 | 代理人: | 孫海波 |
| 地址: | 065001 河北省*** | 國省代碼: | 河北;13 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 數據庫 關聯關系 數據庫表結構 表間關系 關聯分析算法 數據關聯分析 使用數據 隨機樣本 圖形展示 樣本數據 分析 表結構 導出 解析 | ||
1.一種數據庫表結構分析方法,包括從數據庫導出html文件,其特征在于,包括以下步驟:
步驟1:對所述html文件進行解析,并從文件中獲取適當數量的隨機樣本數據;
步驟2:依據所述樣本數據使用數據關聯分析算法,得到可能的關聯關系;
步驟3:分析所述關聯關系的可能性并處理;
步驟4:根據得到的所述關聯關系,以圖形展示數據庫的表間關系。
2.如權利要求1所述的數據庫表結構分析方法,其特征在于:所述步驟2包括以下子步驟:
步驟21:確定并行線程數;
步驟22:多線程并行任務分配;
步驟23:根據所述樣本,遍歷所述Html文件,獲得可能存在關聯的表關系集。
3.如權利要求2所述的數據庫表結構分析方法,其特征在于:通過遞歸或循環的方式實現所述表關系集的獲取,其中采用anlysisAssociation、parseHtmlToDataSet、threadParallel、scan_files、AnsTable和dataNode中至少一種方法和類。
4.如權利要求5所述的數據庫表結構分析方法,其特征在于:所述parseHtmlToDataSet為主方法,遞歸實現用于獲取表關系集。
5.如權利要求6所述的數據庫表結構分析方法,其特征在于:所述AnsTable是解析所述html文件的主體,是獲取所述關系集的主要實現
6.一種數據庫表結構分析系統,包括用于從數據庫中導出html文件的導出模塊,其特征在于,包括以下模塊:
文件解析模塊:用于對所述html文件進行解析,并從文件中獲取適當數量的隨機樣本數據;
數據分析模塊:用于依據所述樣本數據使用數據關聯分析算法,得到可能的關聯關系;
數據處理模塊:用于分析所述關聯關系的可能性并處理;
關系展示模塊:用于根據得到的所述關聯關系,以圖形展示數據庫的表間關系。
7.如權利要求6所述的數據庫表結構分析系統,其特征在于:所述數據分析模塊包括以下子模塊:
線程確定子模塊:用于確定并行線程數;
任務分配子模塊:用于多線程并行任務分配;
遍歷子模塊:用于根據所述樣本,遍歷所述Html文件,獲得可能存在關聯的表關系集。
8.如權利要求7所述的數據庫表結構分析系統,其特征在于:通過遞歸或循環的方式實現所述表關系集的獲取,其中采用anlysisAssociation、parseHtmlToDataSet、threadParallel、scan_files、AnsTable和dataNode中至少一種方法和類。
9.如權利要求8所述的數據庫表結構分析系統,其特征在于:所述dataNode用于存儲數據。
10.如權利要求9所述的數據庫表結構分析系統,其特征在于:所述scan_files這用于讀取所述html文件集。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于新博卓暢技術(北京)有限公司,未經新博卓暢技術(北京)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201711396232.3/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:代理服務器及互聯網數據的采集方法
- 下一篇:一種優化網頁瀏覽的方法





