[發明專利]一種數據庫的處理方法和裝置有效
| 申請號: | 202010029386.4 | 申請日: | 2020-01-10 |
| 公開(公告)號: | CN113111058B | 公開(公告)日: | 2023-03-28 |
| 發明(設計)人: | 李國良;余翔;楊迪 | 申請(專利權)人: | 華為技術有限公司;清華大學 |
| 主分類號: | G06F16/22 | 分類號: | G06F16/22;G06N3/0442 |
| 代理公司: | 深圳市深佳知識產權代理事務所(普通合伙) 44285 | 代理人: | 王仲凱 |
| 地址: | 518129 廣東*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 數據庫 處理 方法 裝置 | ||
本申請實施例公開了一種數據庫的處理方法和裝置,可以應用在數據庫系統中,用樹狀結構來表示連接順序,并作為神經網絡的輸入,通過為輸入的樹狀結構中不同兄弟節點分配不同的第一參數矩陣,有利于神經網絡全面學習連接順序的信息,得到能夠區別于其他連接順序的表征信息,并基于得到的連接順序的表征信息為連接順序準確的預測代價,進而有利于優化器根據代價預測模塊預測的代價為查詢語句選出代價最低的連接順序。
技術領域
本申請涉及數據庫領域,尤其涉及一種數據庫的處理方法和裝置。
背景技術
數據庫管理系統可以接收數據庫客戶端發送的查詢請求,按照查詢請求對應的計劃執行查詢請求,例如,查看、訪問和/或操縱存儲在數據庫中的數據,向數據庫客戶端返回查詢請求的查詢結果。查詢請求一般用于指示數據庫中待連接的多個原始表的信息,數據庫客戶端生成的計劃用于指示對多個原始表的連接順序。對于一個給定的查詢請求,可以采用不同連接順序連接查詢請求指示的多個原始表,并且,待連接的表的數目越多,該查詢請求對應的連接順序(稱作候選連接順序)越多,即查詢請求對應的候選計劃越多。雖然不同連接順序均能連接查詢請求所指示的多個表,但是按照基于不同連接順序生成的計劃執行查詢請求的代價一般不同,這里假設數據庫管理系統按照基于目標連接順序生成的計劃執行查詢請求的代價最低。為了提高數據庫管理系統對查詢請求的響應效率,數據庫管理系統通常采用優化器為查詢請求選出該目標連接順序。
優化器為查詢請求選出目標連接順序的關鍵在于,提供一種代價預測模塊,其能夠準確的預測按照基于各個候選連接順序生成的計劃執行查詢請求的代價。對于通過強化學習(reinforcement learning,RL)的方法選擇目標連接順序的優化器,代價預測模塊需要對不完整的連接順序的代價進行預測,也就是說,基于當前的連接順序可以生成多個候選計劃,代價預測模塊需要預測按照基于各個候選連接順序生成的多個計劃執行查詢請求的最優代價。
為了便于預測各候選連接順序的代價,代價預測模塊需要對連接順序進行特征提取,得到連接順序的表征信息,根據其表征信息進行代價預測。名為“利用深度強化學習優化連接查詢(Learningto optimize join queries with deep reinforcementlearning)”的文章提供的DQ算法根據表是否在連接順序中來對連接順序進行表征,名為“枚舉連接順序的深度強化學習(Deep reinforcement learning for joinorderenumeration)”的文章提供的ReJOIN算法使用在連接表的深度構造連接順序的特征信息,可見,現有技術在對連接順序進行特征提取的過程中,僅能片面學習連接順序中的部分信息,例如僅學習連接順序中涉及的表的信息,容易出現連接順序不同而其表征信息相同的情況。
現有技術為不同連接順序生成的表征信息可能相同,這將導致代價預測模塊為不同連接順序預測的代價可能相同,這不利于代價預測模塊為連接順序準確的預測代價,進而不利于優化器根據代價預測模塊預測的代價為查詢語句選出目標連接順序。
發明內容
第一方面,本申請實施例提供數據庫的處理方法,包括:獲取用于表示數據庫中多個原始表的連接順序的樹狀結構,所述連接順序為根據用于操作所述數據庫中的數據的查詢請求確定的,所述操作涉及對所述多個原始表的連接操作,所述樹狀結構包括第一連接樹,所述第一連接樹表示用于連接所述多個原始表中至少兩個原始表的一個或多個連接操作;將所述樹狀結構輸入神經網絡,所述神經網絡包括第一特征提取層和代價預測層;所述第一特征提取層根據所述第一連接樹中各子節點的位置分別為各子節點分配第一參數矩陣,并根據為所述第一連接樹中各子節點分配的第一參數矩陣對所述第一連接樹進行特征提取,以得到所述第一連接樹的表征信息,所述第一參數矩陣為所述第一特征提取層在訓練過程中得到的;所述代價預測層根據所述樹狀結構的表征信息預測按照第一計劃執行所述查詢請求的代價,并輸出預測的所述代價,所述第一計劃為根據所述連接順序生成的,所述樹狀結構的表征信息為根據所述第一連接樹的表征信息確定的。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于華為技術有限公司;清華大學,未經華為技術有限公司;清華大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010029386.4/2.html,轉載請聲明來源鉆瓜專利網。





