[發明專利]不明確地理引用的分類有效
| 申請號: | 200580048642.8 | 申請日: | 2005-12-30 |
| 公開(公告)號: | CN101128821A | 公開(公告)日: | 2008-02-20 |
| 發明(設計)人: | 丹尼爾·艾尼奧 | 申請(專利權)人: | 谷歌公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 中原信達知識產權代理有限責任公司 | 代理人: | 鄭立;車文 |
| 地址: | 美國加利*** | 國省代碼: | 美國;US |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 不明確 地理 引用 分類 | ||
1.一種確定文檔的地理關聯性的方法,包括:
接收與所述文檔中至少一個字符串相關聯的至少一個地理相關性分布曲線;
從所述至少一個地理相關性分布曲線獲取用于所述文檔的組合地理相關性分布曲線;以及
根據所述組合地理相關性分布曲線確定所述文檔的地理相關性。
2.根據權利要求1的方法,其中所述的至少一個地理相關性分布曲線包括多個地理相關性分布曲線,并且所述的多個地理相關性分布曲線的每個是把字符串的出現次數與地理區域關聯起來的的直方圖。
3.根據權利要求2的方法,其中獲取所述的組合地理相關性分布曲線包括:
把所述的多個直方圖相乘。
4.根據權利要求1的方法,其中根據所述的組合地理相關性分布曲線確定所述文檔的地理相關性包括:
分析所述的組合地理相關性分布曲線的峰值。
5.根據權利要求1的方法,其中接收至少一個地理相關性分布曲線包括:
檢查所述文檔,通過把該文檔中的字符串與多個字符串做比較來定位所述的至少一個字符串,先前對該多個字符串生成了地理相關性分布曲線。
6.根據權利要求1的方法,其中所述至少一個字符串是單個的詞語字符串。
7.根據權利要求1的方法,其中所述的至少一個字符串包括雙詞。
8.根據權利要求1的方法,其中所述的文檔是網頁。
9.根據權利要求1的方法,其中所述的文檔是搜索查詢。
10.一種位置分類器,包括:
用于接收輸入文本的裝置;
在輸入文本內定位那些先前被確定為地理相關的字符串的裝置;
為所定位的各字符串檢索地理相關性分布曲線的裝置;以及
根據檢索到的地理相關性分布曲線確定所述輸入文本是否是地理相關的裝置。
11.根據權利要求10的位置分類器,進一步包括:
用于組合所檢索的地理相關性分布曲線的裝置。
12.一種包含由處理器執行的編程指令的計算機可讀介質,該計算機可讀介質包括:
用于接收與文檔中的相應多個字符串相關聯的多個地理相關性分布曲線的編程指令,所述的地理相關性分布曲線的每一個都定義了該字符串相對于各地理區域的地理相關性;以及
根據所述的多個地理相關性分布曲線確定所述文檔的地理相關性的編程指令。
13.根據權利要求12的計算機可讀介質,進一步包括:
用于組合所述的多個地理相關性分布曲線以獲取用于所述文檔的組合地理相關性分布曲線的編程指令。
14.根據權利要求13的計算機可讀介質,其中用于組合所述的地理相關性分布曲線的編程指令包括:
用于將所述的多個地理相關性分布曲線相乘在一起的編程指令。
15.根據權利要求13的計算機可讀介質,其中所述的用于確定所述文檔的地理相關性的編程指令進一步包括:
用于分析所述組合地理相關性分布曲線峰值的編程指令。
16.根據權利要求12的計算機可讀介質,其中所述的多個地理相關性分布曲線包括直方圖。
17.根據權利要求12的計算機可讀介質,其中所述的字符串包括單個詞語字符串。
18.根據權利要求12的計算機可讀介質,其中所述的字符串包括雙詞。
19.根據權利要求12的計算機可讀介質,其中所述的文檔是網頁。
20.根據權利要求12的計算機可讀介質,其中所述的文檔是搜索查詢。
21.一種產生字符串的地理相關性分布曲線的方法,該方法包括:
確定訓練文本的多個段,其中訓練文本的每個段與某個地理區域相關聯;
在所述的訓練文本的多個選擇段中累計字符串的出現次數;以及
根據所累計的字符串出現次數生成作為直方圖的地理相關性分布曲線。
22.根據權利要求21的方法,其中所述的直方圖把所述字符串的出現次數同地理區域相關聯。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于谷歌公司,未經谷歌公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/200580048642.8/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:用于植物中種子偏好性表達的表達盒
- 下一篇:用于分析物體的方法和設備





