[發明專利]一種基于循環神經網絡的數據庫查詢時間預測方法有效
| 申請號: | 201710647281.3 | 申請日: | 2017-08-01 |
| 公開(公告)號: | CN107491508B | 公開(公告)日: | 2020-05-26 |
| 發明(設計)人: | 伍賽;畢里緣;陳珂;陳剛;壽黎但;胡天磊 | 申請(專利權)人: | 浙江大學 |
| 主分類號: | G06F16/2453 | 分類號: | G06F16/2453;G06F16/2455 |
| 代理公司: | 杭州求是專利事務所有限公司 33200 | 代理人: | 林超 |
| 地址: | 310058 浙江*** | 國省代碼: | 浙江;33 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 循環 神經網絡 數據庫 查詢 時間 預測 方法 | ||
1.一種基于循環神經網絡的數據庫查詢時間預測方法,其特點在于:所述方法的具體步驟如下:
(1)首先從數據庫歷史查詢記錄中抽取出查詢計劃構成原始數據,一條查詢計劃包含了多個操作及其對應的運行時間;
(2)按照查詢計劃的運行時間長短將原始數據分類,使得每類中包含的查詢計劃的數量相等;
(3)對查詢計劃進行特殊處理獲得操作序列,并將查詢計劃中的所有運行時間按照操作序列中的順序對應排列組成運行時間序列;
所述步驟(3)具體采用如下方式將一個查詢計劃處理成特定格式:對于一個查詢計劃中的各個操作,經過后序遍歷生成操作序列;遍歷生成操作序列時,對于查詢計劃中的各個操作提取關鍵特征,將每個操作轉換成一個向量v,向量包含五個部分,第一部分n1代表操作的類型,第二部分n2代表操作在數據庫中指定對應的源表,第三部分n3代表操作在數據庫中指定對應源表的列,第四部分n4代表操作對應輸出結果的平均寬度,第五部分n5代表操作在數據庫中對應數據的分布情況;
所述步驟(3)用一個操作序列Sop={v0,...,vm}表示一個查詢計劃的操作信息,vi是操作序列Sop中第i個操作對應的向量,m表示查詢計劃中操作的總數;
(4)將操作序列作為特征向量和運行時間序列作為標簽,輸入神經網絡訓練并得到模型;
(5)針對待測的查詢計劃,重復步驟(3)獲得其對應的操作序列,再輸入到步驟(4)獲得的神經網絡模型中,輸出與操作序列對應的運行時間序列,完成數據庫查詢時間的預測。
2.根據權利要求1所述的一種基于循環神經網絡的數據庫查詢時間預測方法,其特征在于:所述步驟(4)中,神經網絡模型的第一層是輸入層,中間兩層是隱層,最后一層是輸出層,兩層隱層結構均為LSTM層,隱層所用的激活函數是sigmoid,輸出層的激活函數是softmax,兩個隱層都是100個節點,損失函數是交叉熵代價函數。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于浙江大學,未經浙江大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710647281.3/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:維護推送信息的方法及裝置
- 下一篇:一種用戶屬性信息挖掘方法、裝置和介質





