[發明專利]不明確地理引用的分類有效
| 申請號: | 200580048642.8 | 申請日: | 2005-12-30 |
| 公開(公告)號: | CN101128821A | 公開(公告)日: | 2008-02-20 |
| 發明(設計)人: | 丹尼爾·艾尼奧 | 申請(專利權)人: | 谷歌公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 中原信達知識產權代理有限責任公司 | 代理人: | 鄭立;車文 |
| 地址: | 美國加利*** | 國省代碼: | 美國;US |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 不明確 地理 引用 分類 | ||
技術領域
這里描述的系統和方法涉及搜索引擎,以及更具體地,涉及用于分類與地理區域相關的文本的技術。
背景技術
萬維網(“web”)包含大量的信息。然而,定位信息的期望部分常常很困難。這個問題是復雜的,因為web上的信息量和缺乏web搜索經驗的新用戶數量都在快速增長。
搜索引擎試圖返回用戶感興趣的網網頁的超鏈接。通常,搜索引擎根據用戶輸入的搜索詞語(稱為搜索查詢,search?query)來判定什么是用戶所感興趣的。搜索引擎的目的是根據搜索查詢提供高質量的、相關的結果(例如,網頁)給用戶。典型地,搜索引擎通過匹配搜索查詢中的詞語與預先存儲的網頁的語料庫來實現這一目的。包含用戶搜索詞語的網頁被“命中”并且作為鏈接返回給用戶。
為了提高返回給用戶的網頁的相關性和質量,搜索引擎試圖對命中的列表做排序,使得更相關和/或更高質量的網頁位于返回給用戶的命中列表的上部。例如,搜索引擎可以對每個命中頁分配排名或者得分,其中設計得分使得對應于網頁的相關性和重要性。
局部搜索引擎是試圖返回特定地理區域內的相關網頁的搜索引擎。當索引用于局部搜索引擎的文檔時,期望能夠在合適的情況下自動將文檔或者文檔的部分與該特定地理區域相關聯。例如,與紐約市內的某餐館相關的網頁應該與紐約市相關聯。在很多情況下,特定地理區域的網頁包含郵政地址或者其他的可以明確將該網頁與該地理區域相關聯的地理信息。但是,在其他情況下,網頁可能與特定地理區域有關聯,但是這些網頁可能僅僅包含部分郵政地址信息或者包含不能輕易識別的與特定地理位置相關的其他詞語。這使得難于確定網頁所關聯的地理區域。
發明內容
本發明的一個方面是面向一種確定文檔的地理相關性的方法。該方法包括接收與文檔中至少一個字符串相關聯的至少一個地理相關性分布曲線,從所述至少一個地理相關性分布曲線獲得用于所述文檔的組合地理相關性分布曲線,以及根據所述的組合地理相關性分布曲線確定所述文檔的地理相關性。
本發明的另一個方面面向一種包含可以由處理器執行的編程指令的計算機可讀介質。該計算機可讀介質包括編程指令,用于接收與文檔中的相應的多個字符串相關聯的多個地理相關性分布曲線,所述的地理相關性分布曲線的每一個都定義了與地理區域相關的字符串的地理相關性。所述的計算機可讀介質包括編程指令,根據所述的多個地理相關性分布曲線確定所述文檔的地理相關性的。
而本發明的另一個方面面向一種對于字符串產生地理相關性分布曲線的方法。該方法包括確定訓練文本的多個段,其中訓練文本的每個段與地理區域相關聯,在所述訓練文本的多個選擇段中累計字符串的出現,以及根據所累計的字符串的出現產生作為直方圖的地理相關性分布曲線。
附圖說明
在此結合并作為說明書的一部分的附圖,說明了本發明的一個實施例,并且結合描述來解釋本發明。其中
圖1是符合本發明的各方面的一般概念的示意圖;
圖2是其中符合本發明的原理的系統和方法可以執行的網絡的示范性示意圖;
圖3是在圖2中示出的客戶端和服務器的示范性示意圖;
圖4是說明用于訓練在圖1和2中示出的位置分類器引擎的示范性程序的流程圖;
圖5是說明其中呈現了兩個地理信號的示范性文檔的示意圖;
圖6是說明訓練數據的示范性表格的一部分的示意圖;
圖7A-7C是說明用于詞語/短語的示范性地理相關性分布曲線的示意圖;
圖8是說明包含示范性詞語/短語以及它們的相應地理相關性分布曲線的表格的概念性示意圖;
圖9是說明在確定輸入文檔的潛在相關性地理區域中位置分類器的示范性操作的流程圖;
圖10A-10C說明了組合多個地理相關性分布曲線以獲取組合分布曲線;以及
圖11是說明在搜索引擎的環境下實施的位置分類器的示范性實施的示意圖。
具體實施方式
以下本發明的詳細描述參照了附圖。詳細描述不限制本發明。
概述
在這里描述了在合適的情況下自動分類輸入文本到特定的地理區域的位置分類器。圖1是說明符合本發明的各方面的一般概念的示意圖,包括位置分類器100。作為位置分類器的操作的一個例子,考慮輸入文檔,例如在圖1中示出的示范性文檔,描述了在加利福尼亞的Mountain?View的Castro?Street的商業企業,但是并不特別包含全部的郵政地址、電話號碼,并且從未明確陳述“Mountain?View,California”。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于谷歌公司,未經谷歌公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/200580048642.8/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:用于植物中種子偏好性表達的表達盒
- 下一篇:用于分析物體的方法和設備





