[發明專利]一種面向多負載的云數據庫二級索引自動推薦方法和系統有效
| 申請號: | 202110579171.4 | 申請日: | 2021-05-26 |
| 公開(公告)號: | CN113360497B | 公開(公告)日: | 2022-04-05 |
| 發明(設計)人: | 李春花;周可;孫瀟;方浩天;狄時禹;朱建平 | 申請(專利權)人: | 華中科技大學;騰訊科技(深圳)有限公司 |
| 主分類號: | G06F16/22 | 分類號: | G06F16/22;G06F16/9535;G06K9/62;G06N3/04 |
| 代理公司: | 武漢臻誠專利代理事務所(普通合伙) 42233 | 代理人: | 宋業斌 |
| 地址: | 430070 湖北省武漢*** | 國省代碼: | 湖北;42 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 面向 負載 數據庫 二級 索引 自動 推薦 方法 系統 | ||
1.一種面向多負載的云數據庫二級索引自動推薦方法,其特征在于,包括以下步驟:
(1)從數據庫中的查詢語句集合中隨機選擇多個查詢語句組成查詢語句樣本集{q1,q2,...,qR},對樣本集進行向量化處理,以得到查詢語句向量組{x1,x2,...,xR},其中qi表示第i個查詢語句,i∈[1,R],R表示樣本集中的查詢語句總數,xi表示qi向量化后的結果;
(2)使用k-means算法對步驟(1)得到的向量組進行聚類分析,以得到k個2*N維向量作為k個查詢模板、以及k個查詢模板中每一個查詢模板的權重,并用這k個查詢模板表示整個查詢語句集合的特征;
(3)將步驟(2)中得到的k個查詢模板、以及每個查詢模板的權重輸入到預先訓練好的多負載索引推薦模型中,以得到索引配置;多負載索引推薦模型包括第一全連接神經網絡、第二全連接神經網絡和第三全連接神經網絡;
第三全連接神經網絡是通過以下步驟訓練得到的:
A1、使用Python產生多個隨機的查詢語句及其對應的索引,隨機產生查詢語句對應的查詢條件中所包含的屬性和屬性的選擇度,將產生的每個查詢語句輸入其對應索引的數據庫中,以得到每個查詢語句在其對應索引下的查詢時間,對每個查詢語句及其對應索引分別進行向量化處理,以得到兩個向量,將這兩個向量拼接成一個向量,該拼接后的向量作為該查詢語句對應的樣本的輸入,查詢時間作為該查詢語句對應的樣本的輸出,所有查詢語句對應的樣本的輸入和所有查詢語句對應的樣本的輸出構成數據集,將數據集按照9∶1的比例分為訓練集和測試集;
A2、根據方差損失函數、并利用步驟A1得到的訓練集對第三全連接神經網絡進行迭代訓練,直到其收斂為止,從而得到初步訓練好的第三全連接神經網絡;
A3、使用步驟A1得到的測試集對步驟A2初步訓練好的第三全連接神經網絡進行驗證,以得到訓練好的第三全連接神經網絡。
2.根據權利要求1所述的面向多負載的云數據庫二級索引自動推薦方法,其特征在于,
步驟(1)中向量化處理的過程,是針對每一個查詢語句qi而言,使用該查詢語句的選擇度、以及該查詢語句是否包含屬性來對該查詢語句qi進行向量化,qi向量化后的結果xi是一個2*N維的向量,且有:
xi=(ai,1,...,ai,N,ci,1,...,ci,N)
其中N為樣本集中所有查詢語句包含的屬性的個數,ai,j表示查詢語句qi對應的查詢條件中是否包含屬性fj,如果包含則ai,j=1,此時ci,j為查詢語句qi在屬性fj上的選擇度,即查詢條件中該屬性fj可返回的結果數在數據庫中所占的比例;如果不包含則ai,j=0,此時ci,j=1,j∈[1,N]。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于華中科技大學;騰訊科技(深圳)有限公司,未經華中科技大學;騰訊科技(深圳)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110579171.4/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種精密磨床
- 下一篇:集成電路及其形成方法





