[發(fā)明專利]確定關系數(shù)據(jù)庫表關聯(lián)復雜度的方法和裝置有效
| 申請?zhí)枺?/td> | 201610329065.X | 申請日: | 2016-05-18 |
| 公開(公告)號: | CN107402920B | 公開(公告)日: | 2020-02-07 |
| 發(fā)明(設計)人: | 許文靖 | 申請(專利權)人: | 北京京東尚科信息技術有限公司;北京京東世紀貿易有限公司 |
| 主分類號: | G06F16/22 | 分類號: | G06F16/22 |
| 代理公司: | 11219 中原信達知識產權代理有限責任公司 | 代理人: | 姜勁;陸錦華 |
| 地址: | 100195 北京市海淀區(qū)杏石口路6*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 確定 關系 數(shù)據(jù)庫 關聯(lián) 復雜度 方法 裝置 | ||
1.一種確定關系數(shù)據(jù)庫表關聯(lián)復雜度的方法,其特征在于,包括:
獲取基于關系數(shù)據(jù)庫的應用系統(tǒng)的日志文件和/或配置文件,并對獲取的文件中的每條記錄做分詞以得到多個詞;
根據(jù)預先保存的表數(shù)據(jù)詞典對所述每條記錄中的所述多個詞進行篩選以得到每條記錄的分詞序列;所述表數(shù)據(jù)庫詞典包括數(shù)據(jù)庫表名和預設的語法關鍵詞;
根據(jù)每一個所述分詞序列生成對應于該分詞序列的關聯(lián)指紋,再根據(jù)所得到的關聯(lián)指紋生成關聯(lián)圖數(shù)據(jù)結構;其中,所述關聯(lián)指紋是標示關聯(lián)開始的語法關鍵詞和標示關聯(lián)結束的語法關鍵詞之間的數(shù)據(jù)庫表名之間的關聯(lián)關系,將數(shù)據(jù)庫表名記為所述關聯(lián)圖數(shù)據(jù)結構的頂點,將數(shù)據(jù)庫表名之間的關聯(lián)關系記為所述關聯(lián)圖數(shù)據(jù)結構的邊;
計算所述關聯(lián)圖數(shù)據(jù)結構的復雜度,以及將該關聯(lián)圖數(shù)據(jù)結構的復雜度作為所述關系數(shù)據(jù)庫表的關聯(lián)復雜度。
2.根據(jù)權利要求1所述的方法,其特征在于,所述獲取系統(tǒng)中的日志文件和/或配置文件的步驟之前,還包括:
獲取數(shù)據(jù)庫中的數(shù)據(jù)庫表名;
將所述數(shù)據(jù)庫表名和預設的語法關鍵詞按照設定的格式進行保存以得到表數(shù)據(jù)詞典。
3.根據(jù)權利要求1所述的方法,其特征在于,根據(jù)預先保存的表數(shù)據(jù)詞典對所述每條記錄中的詞進行篩選以得到每條記錄的分詞序列的步驟包括:
將每條記錄中的詞與所述表數(shù)據(jù)詞典中的詞進行比對,將所有存在于所述表數(shù)據(jù)詞典中的詞作為該條記錄的分詞序列。
4.根據(jù)權利要求1所述的方法,其特征在于,根據(jù)每一個分詞序列生成對應于該分詞序列的關聯(lián)指紋的步驟包括:
查找分詞序列中的標示關聯(lián)開始的語法關鍵詞和標示關聯(lián)結束的語法關鍵詞;
根據(jù)分詞序列每一對標示關聯(lián)開始的語法關鍵詞和標示關聯(lián)結束的語法關鍵詞之間的數(shù)據(jù)庫表名生成該分詞序列的關聯(lián)指紋。
5.根據(jù)權利要求4所述的方法,其特征在于,根據(jù)分詞序列每一對標示關聯(lián)開始的語法關鍵詞和標示關聯(lián)結束的語法關鍵詞之間的數(shù)據(jù)庫表名生成該分詞序列的關聯(lián)指紋的步驟包括:
將分詞序列的第一對標示關聯(lián)開始的語法關鍵詞和標示關聯(lián)結束的語法關鍵詞之間所包括的數(shù)據(jù)庫表名去重,然后按照數(shù)據(jù)庫表名的先后順序記錄去重后數(shù)據(jù)庫表名之間的關聯(lián)關系以得到該分詞序列的子關聯(lián)指紋;
將分詞序列的第二對標示關聯(lián)開始的語法關鍵詞和標示關聯(lián)結束的語法關鍵詞之間所包括的數(shù)據(jù)庫表名依次和所述子關聯(lián)指紋中的數(shù)據(jù)庫表名進行比對,并且在該數(shù)據(jù)庫表名與所述子關聯(lián)指紋中的數(shù)據(jù)庫表名不重合的情況下記錄該數(shù)據(jù)庫表名與所述子關聯(lián)指紋中處于最后的數(shù)據(jù)庫表名之間的關聯(lián)關系;
按照標示關聯(lián)開始的語法關鍵詞和標示關聯(lián)結束的語法關鍵詞出現(xiàn)的順序處理該分詞系列中剩余標示關聯(lián)開始的語法關鍵詞和標示關聯(lián)結束的語法關鍵詞之間所包括的數(shù)據(jù)庫表名,從而得到該分詞序列的關聯(lián)指紋。
6.根據(jù)權利要求1至5中任一項所述的方法,其特征在于,根據(jù)所得到的關聯(lián)指紋生成關聯(lián)圖數(shù)據(jù)結構的步驟包括:
統(tǒng)計所有分詞序列的關聯(lián)指紋中的數(shù)據(jù)庫表名,將該數(shù)據(jù)庫表名去重,將去重后剩余的數(shù)據(jù)庫表名記為關聯(lián)圖數(shù)據(jù)結構的頂點;以及將所述剩余的數(shù)據(jù)庫表名之間的關聯(lián)關系記為關聯(lián)圖數(shù)據(jù)結構的邊,從而得到關聯(lián)圖數(shù)據(jù)結構。
7.根據(jù)權利要求1至5中任一項所述的方法,其特征在于,計算所述關聯(lián)圖數(shù)據(jù)結構的復雜度的步驟包括:
統(tǒng)計所述關聯(lián)圖數(shù)據(jù)結構中所包括的頂點和邊的個數(shù);
根據(jù)公式V(G)=e–n+2計算關聯(lián)圖數(shù)據(jù)結構的復雜度;其中e為關聯(lián)圖數(shù)據(jù)結構的邊的個數(shù);n為關聯(lián)圖數(shù)據(jù)結構的頂點的個數(shù);V(G)為關聯(lián)圖數(shù)據(jù)結構的復雜度。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京京東尚科信息技術有限公司;北京京東世紀貿易有限公司,未經北京京東尚科信息技術有限公司;北京京東世紀貿易有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201610329065.X/1.html,轉載請聲明來源鉆瓜專利網。
- 數(shù)據(jù)庫
- 數(shù)據(jù)庫管理系統(tǒng)及數(shù)據(jù)庫
- 數(shù)據(jù)庫構筑裝置、數(shù)據(jù)庫檢索裝置、數(shù)據(jù)庫裝置、數(shù)據(jù)庫構筑方法、以及數(shù)據(jù)庫檢索方法
- 數(shù)據(jù)庫和數(shù)據(jù)庫處理方法
- 數(shù)據(jù)庫系統(tǒng)、數(shù)據(jù)庫更新方法、數(shù)據(jù)庫以及數(shù)據(jù)庫更新程序
- 容器數(shù)據(jù)庫
- 數(shù)據(jù)庫同步方法及數(shù)據(jù)庫
- 一種MongoDB數(shù)據(jù)庫對象復制延遲監(jiān)控方法和裝置
- 數(shù)據(jù)分布式存儲方法、裝置、電子設備及存儲介質
- 數(shù)據(jù)庫語句執(zhí)行方法及裝置





