[發(fā)明專利]用于搜索的方法和計(jì)算機(jī)系統(tǒng)有效
| 申請(qǐng)?zhí)枺?/td> | 200710181602.1 | 申請(qǐng)日: | 2007-10-19 |
| 公開(公告)號(hào): | CN101201843A | 公開(公告)日: | 2008-06-18 |
| 發(fā)明(設(shè)計(jì))人: | 理查德·M·泰斯;扎卡里·A·加鮑;蒂莫西·P·克拉克;布賴恩·P·沃倫費(fèi)爾特 | 申請(qǐng)(專利權(quán))人: | 國(guó)際商業(yè)機(jī)器公司 |
| 主分類號(hào): | G06F17/30 | 分類號(hào): | G06F17/30 |
| 代理公司: | 北京市柳沈律師事務(wù)所 | 代理人: | 邸萬奎;黃小臨 |
| 地址: | 美國(guó)紐*** | 國(guó)省代碼: | 美國(guó);US |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 用于 搜索 方法 計(jì)算機(jī)系統(tǒng) | ||
技術(shù)領(lǐng)域
本發(fā)明的實(shí)施例總體上涉及搜索在計(jì)算機(jī)系統(tǒng)中存儲(chǔ)的信息的鏈接頁面,并且更具體地,涉及針對(duì)持久(persistent)關(guān)鍵字來搜索根頁面的后代頁面。
背景技術(shù)
多年前,計(jì)算機(jī)是不互相通信的隔離裝置。但是,今天,計(jì)算機(jī)常常連接在網(wǎng)絡(luò)中,如因特網(wǎng)或萬維網(wǎng),并且位于一個(gè)計(jì)算機(jī)(經(jīng)常稱為客戶機(jī))處的用戶可能希望經(jīng)由網(wǎng)絡(luò)存取在多個(gè)其他計(jì)算機(jī)(常常稱為服務(wù)器)處的信息。信息經(jīng)常被存儲(chǔ)在服務(wù)器處,并以頁面為單位被發(fā)送到客戶機(jī),這些頁面經(jīng)由嵌入的超鏈接或鏈接而被連接在一起。鏈接是地址,如被嵌入在帶鏈接頁面中的鏈接頁面的URL(統(tǒng)一資源定位符),當(dāng)其被選擇時(shí),使得該鏈接頁面被檢索。因?yàn)橐蛱鼐W(wǎng)包括如此多的頁面,所以,找到感興趣的頁面可能很難,因此許多公司提供搜索引擎,其允許用戶搜索包含關(guān)鍵字的頁面。
當(dāng)前的搜索引擎一般具有搜索因特網(wǎng)的領(lǐng)域中的針對(duì)于關(guān)鍵字的組合的較強(qiáng)的技術(shù),并且通??烧业浇咏谕慕Y(jié)果并與關(guān)鍵字有關(guān)的頁面。但是,所找到的頁面常常過于廣泛,并且不是用戶期望的特定頁面。相反,常常從所找到的頁面之一鏈接(直接或間接)特定頁面。不幸的是,所找到的頁面常常包含許多鏈接,并且追蹤所有鏈接是乏味且耗時(shí)的。
在針對(duì)這些問題的嘗試中,一些站點(diǎn)提供它們自己的搜索功能,其允許用戶向該特定站點(diǎn)搜索關(guān)鍵字。但是,這些搜索功能僅僅在該站點(diǎn)上存儲(chǔ)了感興趣的頁面的情況下才有用。如果感興趣的頁面不在該站點(diǎn)上,而是從該站點(diǎn)鏈接,則搜索功能不會(huì)找到它。
作為另一技術(shù),一些瀏覽器會(huì)搜索在先前訪問的站點(diǎn)的歷史緩存中標(biāo)識(shí)的站點(diǎn)。如果用戶與先前觀看頁面時(shí)處于相同的計(jì)算機(jī)、使用相同的瀏覽器,并且如果該頁面還未被從歷史緩存中清除出去,則此技術(shù)可能是成功的。但是,用戶越來越具有移動(dòng)性,并且可能使用多種計(jì)算機(jī)和瀏覽器,并且用戶關(guān)心隱私,因而他們常常擦除歷史緩存,因而此技術(shù)的用途是有限的。
由此,所需要的是用于找到從其他頁面直接或間接地鏈接的頁面的增強(qiáng)的技術(shù)。
發(fā)明內(nèi)容
提供了一種方法、設(shè)備、系統(tǒng)和信號(hào)承載介質(zhì)。接收包括主關(guān)鍵字和簡(jiǎn)檔的請(qǐng)求,其中簡(jiǎn)檔包括持久關(guān)鍵字。響應(yīng)于該請(qǐng)求,找到包括與主關(guān)鍵字匹配的第一項(xiàng)目的根頁面。向根頁面的后代頁面搜索匹配持久關(guān)鍵字的第二項(xiàng)目。該搜索確定后代頁面位于源自根頁面的多個(gè)路徑上的多個(gè)層、以及這些層位于從根頁面起的一定深度內(nèi)。找到作為根頁面的后代且包括匹配持久關(guān)鍵字的第二項(xiàng)目的后代頁面。將指向根頁面的根鏈接和指向后代頁面的后代鏈接發(fā)送給請(qǐng)求方。如果提交主關(guān)鍵字的次數(shù)大于閾值數(shù),則將主關(guān)鍵字添加到持久關(guān)鍵字。以此方式,在實(shí)施例中,使得能夠進(jìn)行持久搜索,其允許用戶找到在源自根頁面的路徑上鏈接的頁面,其包括用戶具有持久興趣的持久關(guān)鍵字。
附圖說明
下文中結(jié)合附圖描述本發(fā)明的各種實(shí)施例:
圖1繪出了用于實(shí)現(xiàn)本發(fā)明的實(shí)施例的示例系統(tǒng)的高級(jí)框圖。
圖2繪出了根據(jù)本發(fā)明的實(shí)施例的示例頁面的框圖。
圖3繪出了根據(jù)本發(fā)明的實(shí)施例、用于存儲(chǔ)簡(jiǎn)檔數(shù)據(jù)的示例用戶界面的框圖。
圖4繪出了根據(jù)本發(fā)明的實(shí)施例、用于搜索的示例用戶界面的框圖。
圖5繪出了根據(jù)本發(fā)明的實(shí)施例、用于檢索頁面的示例用戶界面的框圖。
圖6繪出了根據(jù)本發(fā)明的實(shí)施例、用于索引的示例數(shù)據(jù)結(jié)構(gòu)的框圖。
圖7繪出了根據(jù)本發(fā)明的實(shí)施例、用于搜索器(crawler)的示例處理的流程圖。
圖8繪出了根據(jù)本發(fā)明的實(shí)施例、用于利用簡(jiǎn)檔來搜索根頁面的后代頁面的示例處理的流程圖,其中經(jīng)由鏈接找到該根頁面。
圖9繪出了根據(jù)本發(fā)明的實(shí)施例、用于利用簡(jiǎn)檔來搜索根頁面的后代頁面的示例處理的流程圖,其中通過搜索找到該根頁面。
圖10繪出了根據(jù)本發(fā)明的實(shí)施例、用于利用簡(jiǎn)檔來搜索頁面的示例處理的流程圖。
圖11繪出了根據(jù)本發(fā)明的實(shí)施例、用于利用簡(jiǎn)檔來搜索后代頁面的示例處理的流程圖。
然而,應(yīng)注意,附圖僅僅例示了本發(fā)明的示例實(shí)施例,因而不看作是其范圍的限制,本發(fā)明可容納其他等同的有效實(shí)施例。
具體實(shí)施方式
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于國(guó)際商業(yè)機(jī)器公司,未經(jīng)國(guó)際商業(yè)機(jī)器公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/200710181602.1/2.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06F 電數(shù)字?jǐn)?shù)據(jù)處理
G06F17-00 特別適用于特定功能的數(shù)字計(jì)算設(shè)備或數(shù)據(jù)處理設(shè)備或數(shù)據(jù)處理方法
G06F17-10 .復(fù)雜數(shù)學(xué)運(yùn)算的
G06F17-20 .處理自然語言數(shù)據(jù)的
G06F17-30 .信息檢索;及其數(shù)據(jù)庫結(jié)構(gòu)
G06F17-40 .數(shù)據(jù)的獲取和記錄
G06F17-50 .計(jì)算機(jī)輔助設(shè)計(jì)
- 一種數(shù)據(jù)庫讀寫分離的方法和裝置
- 一種手機(jī)動(dòng)漫人物及背景創(chuàng)作方法
- 一種通訊綜合測(cè)試終端的測(cè)試方法
- 一種服裝用人體測(cè)量基準(zhǔn)點(diǎn)的獲取方法
- 系統(tǒng)升級(jí)方法及裝置
- 用于虛擬和接口方法調(diào)用的裝置和方法
- 線程狀態(tài)監(jiān)控方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)
- 一種JAVA智能卡及其虛擬機(jī)組件優(yōu)化方法
- 檢測(cè)程序中方法耗時(shí)的方法、裝置及存儲(chǔ)介質(zhì)
- 函數(shù)的執(zhí)行方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 允許服務(wù)器遠(yuǎn)程訪問未通電的客戶計(jì)算機(jī)系統(tǒng)資產(chǎn)信息的數(shù)據(jù)處理系統(tǒng)和方法
- 無需用戶參與自動(dòng)處理推送的信息的方法、系統(tǒng)與程序
- 在客戶計(jì)算機(jī)系統(tǒng)中遠(yuǎn)程禁止網(wǎng)絡(luò)活動(dòng)的數(shù)據(jù)處理系統(tǒng)和方法
- 在客戶計(jì)算機(jī)系統(tǒng)中遠(yuǎn)程禁止網(wǎng)絡(luò)活動(dòng)的數(shù)據(jù)處理系統(tǒng)和方法
- 分配用于多方應(yīng)用層會(huì)話的資格信息
- 分配用于多方應(yīng)用層會(huì)話的資格信息
- 一種用于多層次對(duì)話的調(diào)節(jié)計(jì)算機(jī)系統(tǒng)的方法
- 一種使用混合云計(jì)算系統(tǒng)進(jìn)行通信的方法
- 遠(yuǎn)程禁止客戶計(jì)算機(jī)系統(tǒng)的數(shù)據(jù)處理系統(tǒng)和方法
- 在客戶計(jì)算機(jī)系統(tǒng)中遠(yuǎn)程禁止網(wǎng)絡(luò)活動(dòng)的數(shù)據(jù)處理系統(tǒng)和方法





