[發明專利]用于網絡文件的多維索引的方法和設備有效
| 申請號: | 201010192559.0 | 申請日: | 2010-06-01 |
| 公開(公告)號: | CN102270201A | 公開(公告)日: | 2011-12-07 |
| 發明(設計)人: | 葛付江;王主龍;孟遙;于浩;賈文杰;何楠;賈曉建;王新文 | 申請(專利權)人: | 富士通株式會社 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 北京集佳知識產權代理有限公司 11227 | 代理人: | 朱勝;陳煒 |
| 地址: | 日本神*** | 國省代碼: | 日本;JP |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 用于 網絡 文件 多維 索引 方法 設備 | ||
1.一種為文檔建立索引的方法,包括:
識別構成所述文檔的特征;
將所述特征中的每一個的維度分類為主維度、次維度和附加維度中之一;
針對所述主維度的特征和所述次維度的特征建立擴展的倒排索引,所述擴展的倒排索引中包含所述次維度的特征;
針對所述附加維度的特征建立倒排索引;
將針對所述主維度的特征和所述次維度的特征建立的擴展的倒排索引與針對所述附加維度的特征建立的倒排索引相結合,得到復合索引;以及
將所述復合索引存儲到索引儲存庫中。
2.根據權利要求1所述的方法,其中,針對所述主維度的特征和所述次維度的特征建立擴展的倒排索引包括:針對所述主維度的特征建立一維索引,并且在所述一維索引中附加所述次維度的特征。
3.根據權利要求1所述的方法,其中,針對所述附加維度的特征建立的倒排索引為多維索引。
4.一種對文檔進行檢索的方法,包括:
將用戶所輸入的特征中的每一個的維度識別為主維度、次維度和附加維度中之一;
根據識別的所述維度將用戶所輸入的特征構造為具有復合索引的特征檢索結構;以及
在執行根據權利要求1-3中任何一項所述的方法而得到的索引儲存庫中進行檢索,以檢索出具有所述特征檢索結構的文檔。
5.一種為文檔建立索引的設備,包括:
識別裝置,用于識別構成所述文檔的特征;
分類裝置,用于將所述識別裝置所識別的特征中的每一個的維度分類為主維度、次維度和附加維度中之一;
主維度與次維度索引裝置,用于針對所述主維度的特征和所述次維度的特征建立擴展的倒排索引,所述擴展的倒排索引中包含所述次維度的特征;
附加維度索引裝置,用于針對所述附加維度的特征建立倒排索引;
復合索引裝置,用于將通過所述主維度與次維度索引裝置針對所述主維度的特征和所述次維度的特征建立的擴展的倒排索引與通過所述附加維度索引裝置針對所述附加維度的特征建立的倒排索引相結合,得到復合索引;以及
索引儲存庫,用于存儲通過所述復合索引裝置得到的復合索引。
6.根據權利要求5所述的設備,其中,所述主維度與次維度索引裝置針對所述主維度中的每一個的特征建立一維索引,并且在所述一維索引中附加所述次維度的特征,以獲得所述擴展的倒排索引。
7.根據權利要求5所述的設備,其中,所述附加維度索引裝置針對所述附加維度的特征建立的倒排索引為多維索引。
8.一種對文檔進行檢索的設備,包括:
輸入裝置,用于接收用戶所輸入的特征;
識別裝置,用于將所述輸入裝置接收的特征中的每一個的維度識別為主維度、次維度和附加維度中之一;
構造裝置,用于根據識別的所述維度將所述輸入裝置接收的特征構造為具有復合索引的特征檢索結構;以及
檢索裝置,用于在根據權利要求5-7中任何一項所述的設備中的索引儲存庫中進行檢索,以檢索出具有所述構造裝置構造的特征檢索結構的文檔。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于富士通株式會社,未經富士通株式會社許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201010192559.0/1.html,轉載請聲明來源鉆瓜專利網。





