[發明專利]用于優化針對垂直存儲式數據庫的查詢的方法和設備無效
| 申請號: | 200710192738.2 | 申請日: | 2007-11-16 |
| 公開(公告)號: | CN101436192A | 公開(公告)日: | 2009-05-20 |
| 發明(設計)人: | 王晨;閆鶯;馬力;潘越 | 申請(專利權)人: | 國際商業機器公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 北京市金杜律師事務所 | 代理人: | 朱海波 |
| 地址: | 美國紐*** | 國省代碼: | 美國;US |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 用于 優化 針對 垂直 存儲 數據庫 查詢 方法 設備 | ||
技術領域
本發明總體涉及數據庫管理領域,并且具體地,本發明涉及一種用于優化針對垂直存儲式數據庫的查詢的方法和設備。
背景技術
已經提出了資源描述框架(RDF:Resources?DescriptionFramework)作為一種用于描述元數據(信息)的語言,尤其是用于描述針對萬維網頁上的資源的元數據。通常,可使用統一資源描述符(URI:Universal?Resource?Identifier)來標識萬維網頁上的資源。隨著語義網絡技術的發展,W3C(萬維網聯盟)已經推薦將RDF作為一種用于在語義網絡應用中的多種資源之間交換信息的標準。
圖1示出了RDF數據存儲表的一個例子。如圖1所示,在RDF數據存儲結構中,RDF數據通常是三元組,包括主語、謂詞(也稱為屬性)和賓語。例如,在圖1所示的存儲表中的第二行的三元組表示了這樣一個事實,即“SXZ是一個教授”,其中“SXZ”是主語,“typeOf(是)”是謂詞,以及“Professor(教授)”是賓語。在圖1所示的存儲表中的第五行的三元組表示了另一個事實,即“SXZ教課程1”,其中“SXZ”是主語,“Teach(教)”是謂詞,以及“Course1(課程1)”是賓語。在當前的RDF中,主語和謂詞的值都應該最終解析為統一資源描述符(URI),而賓語的值既可以是統一資源描述符又可以是文字(literal)值,例如數字或者字符串。
這種RDF數據存儲結構實質上是一種垂直式數據存儲結構,即,每個條目只表示一個簡單的事實,例如,條目“SXZ是一個教授”,以及條目“SXZ教課程1”。相反,傳統的關系數據庫是一種水平式數據存儲結構,即每個條目表示主語的所有關系,例如,條目“SXZ是一個教授,并且教授課程1”。
RDF三元組也可以被表示為一張圖,其中主語可以被表示為圖中的源節點,表示統一資源描述符的賓語可以被表示為圖中的宿節點,以及謂詞可以被表示為連接源節點和宿節點的有向連接。當然,主語可以與多個賓語相關聯。例如,圖1中的三元組可以被表示為如圖2所示的有向圖。關于RDF的完整描述,可參見Frank?Manola和Eric?Miller的“RDF?primer.W3C?recommendation,Feb?2004”,該文件可以通過網址www.w3.org/TR/rdf-primer/獲得。在此引入該文件作為參考。
無疑,RDF正在成為語義網絡的里程碑。為了在企業的廣泛異質數據源之上執行語義查詢,需要將現有數據轉換成為RDF三元組數據。同時,針對RDF三元組數據,已經開發了例如SPARQL的語義網絡查詢語言,用以描述用戶的查詢條件。關于SPARQL的詳細描述,可參見E.Prud’hommeaux和A.Seaborne的“SPARQL?querylanguage?for?RDF.W3C?candidate?recommendation,April?2006”,在此引入該文件作為參考。
經過數十年,已經廣泛接受了成熟的關系數據庫(RDB:Relational?Database)技術來管理各種應用數據。當前,存在兩種常規方法來使用成熟的關系數據庫技術管理RDF數據。一種方法是使用抽取-轉換-裝載(ETL:Extract-transform-load)方法將現有數據移植到特定的基于RDB的RDF三元組存儲庫中,其中用戶可以查詢和管理按照RDF三元組形式存儲的數據。另一種方法是在傳統的關系數據庫上創建虛擬RDF視圖,由此將RDF查詢轉換成為在傳統系統中可執行的結構化查詢語言(SQL:Structured?Query?Language)。本發明關注于第一種方式,即管理和優化在關系數據庫上建立的RDF三元組存儲庫中的RDF數據。
根據基于RDB的RDF三元組存儲庫的存儲設計,可以進一步將三元組存儲庫劃分成為3個類型:即:1)通用RDF三元組存儲庫,2)改進的RDF三元組存儲庫;3)水平/二元表存儲庫。
對于通用RDF三元組存儲庫,直接以具有主語、謂詞和賓語三個列的通用表存儲三元組,其中創建多個組合索引來改進其查詢性能。例如,Oracle?10gR2空間數據庫和Jana2,兩者都采用了典型的通用三元組存儲。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于國際商業機器公司,未經國際商業機器公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/200710192738.2/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:酒瓶蓋
- 下一篇:鋁合金車輪的輪輻掏料加風葉裝置





