[發(fā)明專利]利用索引來搜索結(jié)構(gòu)化文檔的系統(tǒng)和方法有效
| 申請?zhí)枺?/td> | 200810095185.3 | 申請日: | 2008-03-20 |
| 公開(公告)號: | CN101271474A | 公開(公告)日: | 2008-09-24 |
| 發(fā)明(設(shè)計)人: | 酒井美由紀(jì);松井浩二;中西基起 | 申請(專利權(quán))人: | 株式會社東芝;東芝解決方案株式會社 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 北京市中咨律師事務(wù)所 | 代理人: | 楊曉光;于靜 |
| 地址: | 日本*** | 國省代碼: | 日本;JP |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 利用 索引 搜索 結(jié)構(gòu) 文檔 系統(tǒng) 方法 | ||
1、一種結(jié)構(gòu)化文檔搜索系統(tǒng),其特征在于包括:
索引存儲單元,其存儲被對應(yīng)附加給節(jié)點的索引,所述節(jié)點包含在存儲于數(shù)據(jù)庫的結(jié)構(gòu)化文檔中,所述索引包含關(guān)于被對應(yīng)附加所述索引的節(jié)點的節(jié)點信息項和關(guān)于相關(guān)節(jié)點的位置信息項,所述節(jié)點信息項包括關(guān)于被對應(yīng)附加所述索引的節(jié)點的位置信息項,所述相關(guān)節(jié)點是在包括被對應(yīng)附加所述索引的節(jié)點的結(jié)構(gòu)化文檔的樹形結(jié)構(gòu)上與所述被對應(yīng)附加所述索引的節(jié)點具有特定關(guān)系的預(yù)先指定類型的節(jié)點;以及
搜索單元,其被配置為基于來自客戶的搜索請求中指定的搜索條件在所述索引存儲單元中搜索索引,當(dāng)所述搜索條件包括覆蓋多個節(jié)點的值的值搜索條件并且所述搜索條件是指定搜索為所述多個節(jié)點所共有的相關(guān)節(jié)點的特定搜索條件時,所述搜索單元被配置為在所述索引存儲單元中搜索符合所述值搜索條件的索引,并且被配置為從搜索到的索引中獲取關(guān)于為所述搜索到的索引所共有的相關(guān)節(jié)點的位置信息項。
2、根據(jù)權(quán)利要求1所述的結(jié)構(gòu)化文檔搜索系統(tǒng),其特征在于進(jìn)一步包括:
存儲索引信息的索引信息存儲單元,所述索引信息指示被對應(yīng)附加所述索引的節(jié)點的結(jié)構(gòu)和相關(guān)節(jié)點的類型,其中所述相關(guān)節(jié)點在包含所述節(jié)點的結(jié)構(gòu)化文檔的樹狀結(jié)構(gòu)上與所述節(jié)點具有特定關(guān)系;
索引管理單元,其被配置為根據(jù)來自客戶的指定索引的索引請求,將在所述請求中指定的索引信息項添加到所述索引信息存儲單元,所述索引請求包括指定節(jié)點的信息和指定相關(guān)節(jié)點的類型的信息,其中所述節(jié)點是被設(shè)置的索引將被對應(yīng)附加給的節(jié)點,所述相關(guān)節(jié)點在包括所述節(jié)點的結(jié)構(gòu)化文檔上與所述節(jié)點具有特定關(guān)系,而將被添加的所述索引信息項指示被對應(yīng)附加所述索引的節(jié)點的結(jié)構(gòu)和在所述索引請求中指定的相關(guān)節(jié)點的類型;以及
文檔存儲處理單元,其被配置為根據(jù)來自所述客戶的指定存儲結(jié)構(gòu)化文檔的文檔存儲請求來在所述數(shù)據(jù)庫中存儲所述請求中指定的結(jié)構(gòu)化文檔,
其中,當(dāng)與包含在由所述文檔存儲處理單元在所述數(shù)據(jù)庫中存儲的結(jié)構(gòu)化文檔中的節(jié)點有關(guān)的索引信息項已經(jīng)存儲在所述索引信息存儲單元中時,所述索引管理單元將被對應(yīng)附加給所述節(jié)點的索引添加到所述索引存儲單元,被對應(yīng)附加給所述節(jié)點的所述索引包括關(guān)于所述節(jié)點的節(jié)點信息項和關(guān)于所述節(jié)點的相關(guān)節(jié)點的位置信息項,所述節(jié)點的相關(guān)節(jié)點的類型由關(guān)于所述節(jié)點的索引信息項來指示。
3、根據(jù)權(quán)利要求1所述的結(jié)構(gòu)化文檔搜索系統(tǒng),其特征在于:
包含在所述索引中的所述節(jié)點信息項包括節(jié)點的值;以及
所述索引存儲單元是將所述索引作為值索引進(jìn)行存儲的值索引存儲單元。
4、根據(jù)權(quán)利要求3所述的結(jié)構(gòu)化文檔搜索系統(tǒng),其特征在于進(jìn)一步包括結(jié)構(gòu)索引存儲單元,其存儲被對應(yīng)附加給節(jié)點的結(jié)構(gòu)索引,所述節(jié)點包含在存儲于所述數(shù)據(jù)庫中的所述結(jié)構(gòu)化文檔中,所述結(jié)構(gòu)索引包括指示被對應(yīng)附加所述索引的節(jié)點的結(jié)構(gòu)的結(jié)構(gòu)信息項和關(guān)于所述節(jié)點的位置信息項,
其中所述搜索單元包括:
值索引搜索模塊,其被配置為當(dāng)搜索請求中指定的搜索條件是指定的搜索條件時,在所述值索引存儲單元中搜索符合所述指定的搜索條件中包含的值搜索條件的節(jié)點的值索引作為候選節(jié)點的值索引,所述值索引搜索模塊被配置為基于搜索到的值索引來獲取相應(yīng)于所述值搜索條件的第一候選節(jié)點列表,所述第一候選節(jié)點列表是其值符合所述值搜索條件的候選節(jié)點以及所述候選節(jié)點的相關(guān)節(jié)點的列表,
結(jié)構(gòu)索引搜索模塊,其被配置為在結(jié)構(gòu)索引存儲單元中搜索其結(jié)構(gòu)符合所述值搜索條件的節(jié)點的結(jié)構(gòu)索引作為候選節(jié)點的結(jié)構(gòu)索引,所述結(jié)構(gòu)索引搜索模塊被配置為基于搜索到的結(jié)構(gòu)索引來獲取相應(yīng)于所述值搜索條件的第二候選節(jié)點列表,所述第二候選節(jié)點列表是其結(jié)構(gòu)符合所述值搜索條件的候選節(jié)點的列表,以及
搜索結(jié)果獲取模塊,其被配置為從包含在根據(jù)所述值搜索條件而獲取的所述第一候選節(jié)點列表和所述第二候選節(jié)點列表中的候選節(jié)點的相關(guān)節(jié)點中,獲取為所述第一候選節(jié)點列表所共有的相關(guān)節(jié)點作為搜索結(jié)果。
5、根據(jù)權(quán)利要求4所述的結(jié)構(gòu)化文檔搜索系統(tǒng),其特征在于所述搜索結(jié)果獲取模塊被配置為通過根據(jù)包括在第一候選節(jié)點列表和第二候選節(jié)點列表這兩個列表中的候選節(jié)點將這兩個列表合并,來獲取第三候選節(jié)點列表,并進(jìn)一步被配置為獲取為所述第三候選節(jié)點列表所共有的相關(guān)節(jié)點作為搜索結(jié)果。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于株式會社東芝;東芝解決方案株式會社,未經(jīng)株式會社東芝;東芝解決方案株式會社許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/200810095185.3/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 卡片結(jié)構(gòu)、插座結(jié)構(gòu)及其組合結(jié)構(gòu)
- 鋼結(jié)構(gòu)平臺結(jié)構(gòu)
- 鋼結(jié)構(gòu)支撐結(jié)構(gòu)
- 鋼結(jié)構(gòu)支撐結(jié)構(gòu)
- 單元結(jié)構(gòu)、結(jié)構(gòu)部件和夾層結(jié)構(gòu)
- 鋼結(jié)構(gòu)扶梯結(jié)構(gòu)
- 鋼結(jié)構(gòu)隔墻結(jié)構(gòu)
- 鋼結(jié)構(gòu)連接結(jié)構(gòu)
- 螺紋結(jié)構(gòu)、螺孔結(jié)構(gòu)、機械結(jié)構(gòu)和光學(xué)結(jié)構(gòu)
- 螺紋結(jié)構(gòu)、螺孔結(jié)構(gòu)、機械結(jié)構(gòu)和光學(xué)結(jié)構(gòu)





