[發(fā)明專利]表分類裝置、表分類方法以及表分類程序無效
| 申請?zhí)枺?/td> | 200910130228.1 | 申請日: | 2009-03-26 |
| 公開(公告)號: | CN101639859A | 公開(公告)日: | 2010-02-03 |
| 發(fā)明(設(shè)計(jì))人: | 高山茂伸;桐村綾子 | 申請(專利權(quán))人: | 三菱電機(jī)株式會社 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 中國國際貿(mào)易促進(jìn)委員會專利商標(biāo)事務(wù)所 | 代理人: | 李今子 |
| 地址: | 日本*** | 國省代碼: | 日本;JP |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 分類 裝置 方法 以及 程序 | ||
技術(shù)領(lǐng)域
本發(fā)明例如涉及對數(shù)據(jù)庫所具有的多個(gè)表進(jìn)行分類的技術(shù)。
背景技術(shù)
在企業(yè)中混合存在各種數(shù)據(jù)庫,數(shù)據(jù)庫逐漸變得大規(guī)模化、復(fù)雜化。在企業(yè)內(nèi)或企業(yè)之間合并各種數(shù)據(jù)庫時(shí),為了實(shí)現(xiàn)數(shù)據(jù)的整合性,需要合并表示相同內(nèi)容的表或列。因此,首先,根據(jù)數(shù)據(jù)庫、建模的專業(yè)人員調(diào)查了數(shù)據(jù)庫的說明書而得到的結(jié)果,或者屬于各自組織中的專業(yè)人員的意見,制作類似的表(table)、列(column)、或冗余的表、列的一覽表。然后,根據(jù)所制作的一覽表,合并數(shù)據(jù)庫。
近年來,作為數(shù)據(jù)庫的合并,已開發(fā)出了支持模式匹配的工具。該工具從整個(gè)公司的數(shù)據(jù)庫中檢索出類似名稱的表、列來支持合并。
在非專利文獻(xiàn)1中,記載有關(guān)于模式合并這樣的觀點(diǎn)下的合并方法。在非專利文獻(xiàn)1中示出了如下例子:在對構(gòu)成表的列類型進(jìn)行分類時(shí),考慮列的類型、是否為關(guān)鍵字項(xiàng)等來比較列彼此。但是,在非專利文獻(xiàn)1中,雖然有關(guān)于比較列彼此的記載,但沒有關(guān)于根據(jù)構(gòu)成表的列的類型等來比較表彼此的記載。
非專利文獻(xiàn)1:Rahm,E.and?Bernstein,P.A.:A?survey?ofapproaches?to?automatic?schema?matching.VLDB?J(10)pp.334-350,2001
在企業(yè)內(nèi)或企業(yè)之間的數(shù)據(jù)庫的合并中,在大規(guī)模的情況下比較達(dá)到數(shù)萬個(gè)的列,從達(dá)到數(shù)百、數(shù)千個(gè)的表中,抽取由相同的列構(gòu)成的表、由類似的列構(gòu)成的表。然后,需要進(jìn)行如下等處理:刪除由相同的列構(gòu)成的表的一方,合并由類似的列構(gòu)成的表。
但是,即使得知了列彼此的類似性,也不容易根據(jù)列彼此的類似性的信息來判斷表彼此是否類似。例如,假設(shè)存在包括相同的列X的表A和表B。在此存在如下情況:在表A中列X是主鍵,而在表B中列X是參照表A的外鍵。在該情況下,即使表A和表B中包含有相同的列X,但表A與表B中的列X的意義(meaning)(作用)不同。即,即使表A和表B中包含相同的列X,也不能說成是類似的表,無法成為合并的對象。這樣,僅通過簡單地比較每個(gè)列的相同性、類似性,無法判斷作為表結(jié)構(gòu)的相同性、類似性。
發(fā)明內(nèi)容
本發(fā)明的目的在于,例如通過將數(shù)據(jù)庫中的多個(gè)表分類為由類似的表構(gòu)成的組,從而使數(shù)據(jù)庫的合并變得容易。
本發(fā)明的表分類裝置例如是將多個(gè)數(shù)據(jù)庫所具有的多個(gè)表分類為多個(gè)組的表分類裝置,其特征在于,具備:
第一分類部,利用處理裝置,根據(jù)包括上述多個(gè)表的各表中的列的位置的列信息來判定上述各表是否類似,根據(jù)判定的結(jié)果,將上述多個(gè)表分類為多個(gè)組;
第二分類部,利用處理裝置,根據(jù)上述各表中的列的位置以外的列信息來判定上述各表是否類似,根據(jù)判定的結(jié)果,將上述多個(gè)表分類為多個(gè)組;以及
輸出部,將由上述第一分類部和上述第二分類部分類的結(jié)果輸出到輸出裝置。
在本發(fā)明的表分類裝置中,根據(jù)包括表中的列的位置的列信息來判定表是否類似。根據(jù)表中的列的位置,能夠判斷該表中的列的作用。因此,根據(jù)本發(fā)明的表分類裝置,能夠考慮表中的列的作用來判斷表的類似性,由此分類表。
附圖說明
圖1是示出表分類裝置1的功能的功能框圖。
圖2是示出表列表11的圖。
圖3是示出表列表11所具有的表節(jié)點(diǎn)111、列節(jié)點(diǎn)112的圖。
圖4是示出列對應(yīng)表14的圖。
圖5是示出列列表12的圖。
圖6是示出頻繁出現(xiàn)列列表13的圖。
圖7是示出意義分類部20的動(dòng)作的流程圖。
圖8是由意義分類部20分類表的說明圖(1)。
圖9是由意義分類部20分類表的說明圖(2)。
圖10是由意義分類部20分類表的說明圖(3)。
圖11是由意義分類部20分類表的說明圖(4)。
圖12是由意義分類部20分類表的說明圖(5)。
圖13是示出表意義分類表21的圖。
圖14是示出統(tǒng)計(jì)分類部30的動(dòng)作的流程圖。
圖15是示出由統(tǒng)計(jì)分類部30分類表的說明圖(1)。
圖16是示出由統(tǒng)計(jì)分類部30分類表的說明圖(2)。
圖17是示出由統(tǒng)計(jì)分類部30分類表的說明圖(3)。
圖18是示出由統(tǒng)計(jì)分類部30分類表的說明圖(4)。
圖19是示出由統(tǒng)計(jì)分類部30分類表的說明圖(5)。
圖20是示出由統(tǒng)計(jì)分類部30分類表的說明圖(6)。
圖21是示出由統(tǒng)計(jì)分類部30分類表的說明圖(7)。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于三菱電機(jī)株式會社,未經(jīng)三菱電機(jī)株式會社許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/200910130228.1/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06F 電數(shù)字?jǐn)?shù)據(jù)處理
G06F17-00 特別適用于特定功能的數(shù)字計(jì)算設(shè)備或數(shù)據(jù)處理設(shè)備或數(shù)據(jù)處理方法
G06F17-10 .復(fù)雜數(shù)學(xué)運(yùn)算的
G06F17-20 .處理自然語言數(shù)據(jù)的
G06F17-30 .信息檢索;及其數(shù)據(jù)庫結(jié)構(gòu)
G06F17-40 .數(shù)據(jù)的獲取和記錄
G06F17-50 .計(jì)算機(jī)輔助設(shè)計(jì)
- 接收裝置以及接收方法、以及程序
- 凈水濾芯以及凈水裝置、以及洗漱臺
- 隱匿檢索系統(tǒng)以及公開參數(shù)生成裝置以及加密裝置以及用戶秘密密鑰生成裝置以及查詢發(fā)布裝置以及檢索裝置以及計(jì)算機(jī)程序以及隱匿檢索方法以及公開參數(shù)生成方法以及加密方法以及用戶秘密密鑰生成方法以及查詢發(fā)布方法以及檢索方法
- 編碼方法以及裝置、解碼方法以及裝置
- 編碼方法以及裝置、解碼方法以及裝置
- 圖片顯示方法以及裝置以及移動(dòng)終端
- ENB以及UEUL發(fā)送以及接收的方法
- X射線探測方法以及裝置以及系統(tǒng)
- 圖書信息錄入方法以及系統(tǒng)以及書架
- 護(hù)耳器以及口罩以及眼鏡





