[發(fā)明專利]數(shù)據(jù)庫的查詢重構(gòu)方法、裝置、設(shè)備及存儲介質(zhì)有效
| 申請?zhí)枺?/td> | 201710581300.7 | 申請日: | 2017-07-17 |
| 公開(公告)號: | CN107480199B | 公開(公告)日: | 2020-06-12 |
| 發(fā)明(設(shè)計)人: | 曲強;張金波 | 申請(專利權(quán))人: | 深圳先進(jìn)技術(shù)研究院 |
| 主分類號: | G06F16/2453 | 分類號: | G06F16/2453 |
| 代理公司: | 深圳智趣知識產(chǎn)權(quán)代理事務(wù)所(普通合伙) 44486 | 代理人: | 王策 |
| 地址: | 518055 廣東省深圳*** | 國省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 數(shù)據(jù)庫 查詢 方法 裝置 設(shè)備 存儲 介質(zhì) | ||
本發(fā)明適用計算機技術(shù)領(lǐng)域,提供了一種數(shù)據(jù)庫的查詢重構(gòu)方法、裝置、設(shè)備及存儲介質(zhì),該方法包括:當(dāng)接收到用戶的查詢請求時,接收用戶輸入的原始查詢,獲取原始查詢在預(yù)設(shè)的數(shù)據(jù)庫上的查詢視圖,根據(jù)查詢視圖對數(shù)據(jù)庫的元組進(jìn)行標(biāo)記,生成數(shù)據(jù)庫的標(biāo)記屬性,獲取用戶指定的屬性,通過預(yù)設(shè)的支持向量機模型對用戶指定的屬性進(jìn)行訓(xùn)練,生成分類超平面,根據(jù)分類超平面的表達(dá)式和用戶指定的屬性,對原始查詢進(jìn)行重構(gòu),生成原始查詢對應(yīng)的替代查詢,從而提高了查詢重構(gòu)效率,進(jìn)而提高數(shù)據(jù)庫系統(tǒng)的查詢效率。
技術(shù)領(lǐng)域
本發(fā)明屬于計算機技術(shù)領(lǐng)域,尤其涉及一種數(shù)據(jù)庫的查詢重構(gòu)方法、裝置、設(shè)備及存儲介質(zhì)。
背景技術(shù)
數(shù)據(jù)庫查詢是數(shù)據(jù)庫系統(tǒng)的重要功能之一。在大數(shù)據(jù)背景下,面對海量的異構(gòu)數(shù)據(jù),數(shù)據(jù)庫技術(shù)也不斷發(fā)展,出現(xiàn)了諸如云管理、分布式數(shù)據(jù)庫、內(nèi)存數(shù)據(jù)庫、NoSQL等多種多樣的數(shù)據(jù)庫系統(tǒng),然而數(shù)據(jù)庫查詢?nèi)匀皇沁@些系統(tǒng)的核心業(yè)務(wù)之一,如何讓用戶對數(shù)據(jù)進(jìn)行快速高效的查詢因此變得尤為重要。使用數(shù)據(jù)查詢語言查詢指定數(shù)據(jù)庫對于非專家用戶通常是一項非常具有挑戰(zhàn)性的任務(wù),尤其是在數(shù)據(jù)模式的不確定性情況下,例如用戶對數(shù)據(jù)存儲的不明確、數(shù)據(jù)存儲結(jié)構(gòu)復(fù)雜以及多變,數(shù)據(jù)查詢往往缺乏模式或者只有不完整的模式來幫助用戶指定其查詢,這使得數(shù)據(jù)庫查詢的效率問題變得更加重要。查詢重構(gòu)可以針對用戶輸入的一個有效的查詢找到一個相同或者相似但是更加高效的替代查詢語句。這一方法也是數(shù)據(jù)庫領(lǐng)域的一個研究熱點問題,可以被廣泛的應(yīng)用在數(shù)據(jù)庫系統(tǒng)查詢優(yōu)化、數(shù)據(jù)反向工程、數(shù)據(jù)庫安全等領(lǐng)域。
當(dāng)用戶輸入一個數(shù)據(jù)庫查詢后,如何找到一個相同或者相似的查詢,該查詢返回與原始查詢相同的結(jié)果,但新生成的查詢執(zhí)行更加高效,這是一個非常有意義和有技術(shù)挑戰(zhàn)的難點問題。例如,在籃球數(shù)據(jù)庫中,可以通過查詢諸如積分、籃板、助攻等多個不同屬性的組合來尋找優(yōu)秀的球員。但是由于涉及模式屬性繁多甚至跨實體,這種組合查詢往往效率不高,如何利用較少數(shù)目且盡可能使用索引屬性重構(gòu)另一個替代查詢并返回相同的結(jié)果具有很高的實踐價值,因為重構(gòu)的查詢涉及較少、較優(yōu)數(shù)據(jù)模式屬性,因而可以使得整個系統(tǒng)具有更高的響應(yīng)效率和反應(yīng)速度,進(jìn)而提高系統(tǒng)性能。
已有數(shù)據(jù)庫數(shù)據(jù)分析技術(shù)主要基于兩類方法:簡單的選擇策略和機器學(xué)習(xí)方法。簡單的選擇策略主要包括最近鄰居方法和子結(jié)構(gòu)搜索方法;機器學(xué)習(xí)方法包括決策樹和神經(jīng)網(wǎng)絡(luò)。簡單的選擇策略缺乏經(jīng)驗指導(dǎo),無法適應(yīng)新的數(shù)據(jù)環(huán)境,已有很多研究證明應(yīng)用機器學(xué)習(xí)方法進(jìn)行數(shù)據(jù)查找優(yōu)于這類方法。決策樹法以“按輸出查詢”(QOP)的形式進(jìn)行查詢重構(gòu):給定一個查詢,使用決策樹生成該查詢的多個實例等效查詢(IEQ)。通過分析多個查詢的成本,可以選擇類似輸出的最優(yōu)查詢。也有一些方法嘗試以視圖定義問題(VDP)解決了這個問題,VDP問題可以為數(shù)據(jù)庫視圖找出最準(zhǔn)確和最簡潔的定義,還可以根據(jù)閾值查找近似的定義。通過為數(shù)據(jù)庫視圖尋找定義的方式可以在一定程度上解決這一問題。
但是,決策樹在處理這一問題時,將屬性分為兩個互斥的集合,導(dǎo)致屬性之間的比較關(guān)系丟失,并且決策樹方法依賴于對數(shù)據(jù)的認(rèn)識,需要用戶提前預(yù)知數(shù)據(jù)的模式屬性,此外,決策樹方法易過擬合。VDP問題沒有挖掘已有的查詢Q和視圖V之間的關(guān)聯(lián),因而生成的查詢跟用戶輸入查詢之間差異很大。
發(fā)明內(nèi)容
本發(fā)明的目的在于提供一種數(shù)據(jù)庫的查詢重構(gòu)方法、裝置、設(shè)備及存儲介質(zhì),旨在解決由于現(xiàn)有數(shù)據(jù)庫系統(tǒng)的查詢重構(gòu)效率低下,導(dǎo)致數(shù)據(jù)庫系統(tǒng)的查詢效率不高的問題。
一方面,本發(fā)明提供了一種數(shù)據(jù)庫的查詢重構(gòu)方法,所述方法包括下述步驟:
當(dāng)接收到用戶的查詢請求時,接收所述用戶輸入的原始查詢,獲取所述原始查詢在預(yù)設(shè)的數(shù)據(jù)庫上的查詢視圖;
根據(jù)所述查詢視圖對所述數(shù)據(jù)庫的元組進(jìn)行標(biāo)記,生成所述數(shù)據(jù)庫的標(biāo)記屬性;
獲取所述用戶指定的屬性,通過預(yù)設(shè)的支持向量機模型對所述用戶指定的屬性進(jìn)行訓(xùn)練,生成分類超平面;
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于深圳先進(jìn)技術(shù)研究院,未經(jīng)深圳先進(jìn)技術(shù)研究院許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710581300.7/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 數(shù)據(jù)庫
- 數(shù)據(jù)庫管理系統(tǒng)及數(shù)據(jù)庫
- 數(shù)據(jù)庫構(gòu)筑裝置、數(shù)據(jù)庫檢索裝置、數(shù)據(jù)庫裝置、數(shù)據(jù)庫構(gòu)筑方法、以及數(shù)據(jù)庫檢索方法
- 數(shù)據(jù)庫和數(shù)據(jù)庫處理方法
- 數(shù)據(jù)庫系統(tǒng)、數(shù)據(jù)庫更新方法、數(shù)據(jù)庫以及數(shù)據(jù)庫更新程序
- 容器數(shù)據(jù)庫
- 數(shù)據(jù)庫同步方法及數(shù)據(jù)庫
- 一種MongoDB數(shù)據(jù)庫對象復(fù)制延遲監(jiān)控方法和裝置
- 數(shù)據(jù)分布式存儲方法、裝置、電子設(shè)備及存儲介質(zhì)
- 數(shù)據(jù)庫語句執(zhí)行方法及裝置





