[發明專利]一種搜索文檔的方法和裝置有效
| 申請號: | 200910109479.1 | 申請日: | 2009-08-19 |
| 公開(公告)號: | CN101996200A | 公開(公告)日: | 2011-03-30 |
| 發明(設計)人: | 胡漢強;閔國兵;董曉藝;顧翀 | 申請(專利權)人: | 華為技術有限公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 518129 廣東*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 搜索 文檔 方法 裝置 | ||
1.一種搜索文檔的方法,其特征在于,包括以下步驟:
元搜索服務器接收用戶的搜索請求,根據所述搜索請求獲取所述用戶歸屬的群組的標識;
所述元搜索服務器根據所述群組標識和預先從成員搜索引擎獲取的與群組對應的各個分級的元索引選擇成員搜索引擎,將所述群組標識和所述搜索請求中的檢索信息發送給所述被選擇的成員搜索引擎,以便于所述被選擇的成員搜索引擎根據所述群組標識和所述搜索請求中的檢索信息從與用戶群組對應的分級標注的文檔中獲取文檔。
2.如權利要求1所述的搜索文檔的方法,其特征在于,所述搜索服務器接收用戶的搜索請求,根據所述搜索請求獲取所述用戶歸屬的群組的標識的步驟具體為:
所述搜索服務器接收用戶的搜索請求,根據所述搜索請求中的用戶信息從用戶數據庫獲取用戶的個性化數據和群組特性,根據所述用戶的個性化數據和群組特性獲取所述用戶歸屬的群組的標識,或,
所述搜索服務器接收用戶的搜索請求,所述搜索請求包含所述用戶歸屬的群組的標識。
3.如權利要求1或2所述的搜索文檔的方法,其特征在于,所述元索引包括文檔中的關鍵詞對于與群組對應的分級標注的各文檔的最大歸一化權重或含有關鍵詞的與群組對應的分級標注的文檔的個數。
4.如權利要求1或2所述的搜索文檔的方法,其特征在于,所述搜索請求還包括與群組對應的分級信息;
所述元搜索服務器根據所述群組標識和預先從成員搜索引擎獲取的與群組對應的各個分級的元索引選擇成員搜索引擎的步驟具體為:
所述元搜索服務器根據所述群組標識、所述與群組對應的分級信息和從預先從成員搜索引擎獲取的與群組對應的該分級的元索引,計算所述搜索請求中的檢索信息與成員搜索引擎的所述群組對應的該分級的文檔內容的相似度,從而選擇相似度最高的一個或多個成員搜索引擎;
所述將所述群組標識和所述搜索請求中的檢索信息發送給所述被選擇的成員搜索引擎,以便于所述被選擇的成員搜索引擎根據所述群組標識和所述搜索請求中的檢索信息從與用戶群組對應的分級標注的文檔中獲取文檔的步驟具體為:
將所述群組標識、所述與群組對應的分級信息和所述搜索請求中的檢索信息發送給所述被選擇的成員搜索引擎,以便于所述被選擇的成員搜索引擎根據所述群組標識、所述與群組對應的分級信息和所述搜索請求中的檢索信息從與用戶群組對應的分級標注的文檔中獲取文檔。
5.如權利要求1或2所述的搜索文檔的方法,其特征在于,所述元搜索服務器根據所述群組標識和預先從成員搜索引擎獲取的與群組對應的各個分級的元索引選擇成員搜索引擎的步驟具體為:
所述元搜索服務器根據所述群組標識和預先從成員搜索引擎獲取的與群組對應的各個分級的元索引計算根據所述搜索請求中的檢索信息與成員搜索引擎的所述群組對應的該分級的文檔內容的相似度與所述群組對應的各個分級的文檔內容重要度評分值的綜合相似度,選擇所述綜合相似度最高的一個或多個成員搜索引擎。
6.如權利要求5所述的搜索文檔的方法,其特征在于,所述被選擇的成員搜索引擎根據所述群組標識和所述搜索請求中的檢索信息從與用戶群組對應的分級標注的文檔中獲取文檔的步驟包括:
所述被選擇的成員搜索引擎根據所述群組標識和所述搜索請求中的檢索信息從預先設定了與用戶群組對應的分級標注的文檔中獲取與所述群組相關的至少根據文檔分級重要度排序的文檔。
7.如權利要求1或2所述的搜索文檔的方法,其特征在于,所述預先從成員搜索引擎獲取與群組對應的各個分級的元索引的步驟具體為:
所述元搜索服務器向所述成員搜索引擎發送包含初始查詢詞、某個群組標識和某個與群組對應的分級的標識的搜索請求;
所述元搜索服務器接收所述成員搜索引擎根據所述某個群組標識、所述某個與群組對應的分級的標識和文檔的群組分級標注返回與該某個群組的該某個分級對應的包含該初始查詢詞的文檔;
所述元搜索服務器檢索所述返回的文檔中的前面N個文檔;
所述元搜索服務器根據檢索的N個文檔更新主要詞典;
所述元搜索服務器根據所述成員搜索引擎的與群組對應的分級的主要詞典里的每一個術語,向所述成員搜索引擎發起每一個術語的查詢,并從成員搜索引擎返回的與群組對應的分級的前N個文檔中提取與群組對應的分級的元索引。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于華為技術有限公司,未經華為技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/200910109479.1/1.html,轉載請聲明來源鉆瓜專利網。





