[發明專利]對結構化數據進行搜索的方法、系統以及使數據項結構化及可搜索的方法、系統有效
| 申請號: | 201010156907.9 | 申請日: | 2005-12-13 |
| 公開(公告)號: | CN101866347B | 公開(公告)日: | 2017-05-17 |
| 發明(設計)人: | 賓杜·雷迪;喬納森·布倫斯曼;寧·莫斯貝格爾;戈拉夫·拉溫德拉·布哈亞;薩拉·西拉杰丁;大衛·卡萊;珍妮弗·L·克森斯基;阿爾文德·孫達瑞拉簡;普涅特·阿加瓦爾 | 申請(專利權)人: | 谷歌公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 中原信達知識產權代理有限責任公司11219 | 代理人: | 張煥生,安翔 |
| 地址: | 美國加利*** | 國省代碼: | 暫無信息 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 結構 數據 進行 搜索 方法 系統 以及 數據項 | ||
相關申請
依據美國專利法第35號第119條(e)款(35 U.S.C.§119(e)),本申請以申請號為11/257,282的美國實用申請為優先權,其標題為“對結構化數據的搜索”,由Reddy等人于2005年10月23日提出申請。本申請與申請號為11/256,883的美國申請有關,其標題為“向結構化數據添加屬性及標簽”,由Reddy等人于2005年10月23日提出申請,通過引用將其結合于此。
背景技術
常規搜索引擎能夠搜索非常巨大的信息集合,諸如萬維網或極其巨大的數據庫。當所搜索的數據集合的規模增長時,常規搜索引擎不再足夠來正確地返回與用戶輸入的查詢詞相匹配的查詢結果。替代地,需要提供機制來幫助用戶揀選從搜索返回的大量數據。
當前幾個常規搜索引擎使用不同的方法來組織在搜索結果中返回的數據。
此種組織方法的目的是判定哪個搜索結果將使用戶發生最大興趣。常規搜索引擎通常使用多種技術來以優先順序排列搜索結果,但是這些技術不理想,因為其必須對用戶正搜索的信息的類型做出假設。例如,如果用戶輸入“工作”,他可能是搜索工作公告、史蒂夫喬布(Steve Jobs)的信息、特定國家的工作統計量、或許多其它項。因此,當使用常規搜索引擎時,用戶不能僅輸入“工作”作為查詢詞。用戶也很可能輸入另外的查詢詞以縮小搜索范圍。遺憾的是,用戶也可能錯過不包含縮小詞的相關收錄。
當前,對可能存儲在萬維網上或不存儲在萬維網上的不同類型的數據進行搜索是困難的。通常常規搜索引擎對僅僅來自少數源的數據進行操作。例如,基于網絡的搜索引擎傳統上允許用戶搜索在萬維網上的頁面。網絡搜索引擎常常具有對信息集合進行索引以使其可搜索的“后臺(back-end)”。例如,基于網絡的搜索引擎周期性地爬行(crawl)萬維網并且創建所爬行的頁面以及站點的索引。其它搜索引擎允許用戶搜索現有的數據庫。此種搜索引擎依賴于數據庫的預先確定的組織。例如,如果數據庫具有已知字段以及屬性,用戶就能夠在其屬性內搜索。例如,XML數據庫僅接受格式完好(well-formed)的XML輸入。如果被搜索的數據不是如此組織的,一般XML數據庫不能接受該數據或不能組織該數據以用于搜索。
其它搜索引擎允許用戶搜索數據庫或搜索具有扁平式組織的文本文檔。此種搜索引擎必須知道關于數據庫的組織以及在數據庫內的文檔的組織。存儲數據的位置的多樣性以及存儲數據的格式的多樣性,意味著用戶必須經常在多個數據庫中的多個位置搜索以找到其需要的信息。
所需要的是,可以通過基于網絡的搜索引擎來搜索文檔集合,以及因而多數人可容易地訪問所述文檔集合,同時所述文檔集合包含了各種類型的文檔以及數據格式。此外,如果以能夠幫助用戶對其搜索進行微調的方法來組織可搜索的文檔集合,這將也是所需要的。
發明內容
本發明的一個方面涉及一種用于對結構化數據進行搜索的計算機實現的方法,該方法包括:從集合中的數據項提取屬性;通過客戶端設備從與搜索引擎交互的用戶接收搜索查詢;接收對來自所述數據項集合的第一數據項的選擇,所述第一數據項滿足所述搜索查詢,并且所述第一數據項共同具有已被從所述第一數據項提取的第一屬性;從所述第一屬性中選擇最普遍的屬性作為核心組的屬性;向所述客戶端設備輸出搜索引擎結果頁面,所述搜索引擎結果頁面包括指向所述第一數據項中的每一個的相應引用,以及所述核心組的每一個屬性的相應表示;響應于對所述核心組的一個或多個屬性的表示的用戶選擇,提供與所述核心組的所選擇的一個或多個屬性相對應的用于接收查詢優化的搜索窗口;以及接收對滿足所述搜索查詢和所述查詢優化的第二數據項的選擇。
本發明的另一個方面涉及一種用于使數據項結構化和可搜索的計算機實現的方法,該方法包括:接收并存儲被一個或多個提供者擁有的數據;提供用戶界面由所述一個或多個提供者中的每一個使用,所述用戶界面包括由所述一個或多個提供者中的任何一個用來將標簽或屬性人工關聯到他們所擁有的數據的區域;通過所述用戶界面從所述一個或多個提供者接收與相應提供者擁有的數據有關的標簽或屬性,所述屬性的每一個包括屬性名稱和屬性值;對所接收的標簽或屬性進行索引;以及使用所索引的標簽或屬性來在搜索引擎中生成搜索引擎結果。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于谷歌公司,未經谷歌公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201010156907.9/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:多關節機器人
- 下一篇:崇拜信直接管理運營系統及方法
- 數據顯示系統、數據中繼設備、數據中繼方法、數據系統、接收設備和數據讀取方法
- 數據記錄方法、數據記錄裝置、數據記錄媒體、數據重播方法和數據重播裝置
- 數據發送方法、數據發送系統、數據發送裝置以及數據結構
- 數據顯示系統、數據中繼設備、數據中繼方法及數據系統
- 數據嵌入裝置、數據嵌入方法、數據提取裝置及數據提取方法
- 數據管理裝置、數據編輯裝置、數據閱覽裝置、數據管理方法、數據編輯方法以及數據閱覽方法
- 數據發送和數據接收設備、數據發送和數據接收方法
- 數據發送裝置、數據接收裝置、數據收發系統、數據發送方法、數據接收方法和數據收發方法
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置





