[發明專利]遞歸地遍歷因特網和其他源以識別、收集、管理、評判和鑒定企業身份及相關數據的系統和方法在審
| 申請號: | 201380052519.8 | 申請日: | 2013-10-07 |
| 公開(公告)號: | CN104769585A | 公開(公告)日: | 2015-07-08 |
| 發明(設計)人: | 安東尼·J·斯克里菲尼亞諾;邁克爾·克萊內;唐·Q·霍安;溫德拉·拉姆保羅;羅賓·戴維斯;安賈莉·雷迪 | 申請(專利權)人: | 鄧白氏公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 北京集佳知識產權代理有限公司 11227 | 代理人: | 康建峰;陳煒 |
| 地址: | 美國新*** | 國省代碼: | 美國;US |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 遞歸 遍歷 因特網 其他 識別 收集 管理 評判 鑒定 企業 身份 相關 數據 系統 方法 | ||
1.一種用于搜索與查詢有關的數據的系統,包括:
存儲裝置,所述存儲裝置包含種子源的列表,所述種子源的列表指定所述查詢的初始搜索目標;
搜索引擎,所述搜索引擎基于從所述初始搜索目標和任何現有附加搜索目標識別的數據和元數據來對所述初始搜索目標進行搜索,以找到與所述查詢有關的數據;
所述存儲裝置存儲來自所述初始搜索目標和所述任何附加搜索目標的數據和元數據;并且
其中,所述搜索引擎對所述附加搜索目標進行搜索,以至少找到與所述查詢有關的附加數據以及找到指定另外的附加搜索目標的數據和元數據。
2.根據權利要求1所述的系統,其中,當所述搜索引擎搜索所述附加搜索目標并且發現了另外的搜索目標時,指定所述另外的搜索目標的數據和任何相關元數據被存儲在所述存儲裝置中,以由所述搜索引擎在訪問所述另外的目標時使用。
3.根據權利要求1所述的系統,其中,對所述附加搜索目標進行搜索以及對另外的搜索目標進行發現,直到對所述附加搜索目標的搜索不再產生要搜索的另外的搜索目標為止或者直到可接受的評判規則或例外規則被滿足為止。
4.根據權利要求1所述的系統,其中,所述另外的搜索目標通過遞歸和窮舉處理被發現,由此基于來自現有搜索的結果和搜索目標的數據和元數據來識別搜索目標。
5.根據權利要求1所述的系統,其中,所述搜索引擎被配置成搜索網站或其他源,并且所述種子源的列表是所述網站或其他源的列表。
6.根據權利要求1所述的系統,其中,處理器被配置成對從每個搜索目標獲得的數據進行凈化。
7.根據權利要求6所述的系統,其中,所述處理器被配置成通過一些步驟來凈化數據,所述步驟包括下述步驟中的至少一個步驟:解析所述數據,去除所述數據的錯誤值或不適當的值,以及從所述數據去除預定標記。
8.根據權利要求1所述的系統,還包括處理器,所述處理器被配置成通過執行下述步驟來執行對給定數據的數據驗證,所述步驟包括:
對來自已搜索的搜索目標的所述給定數據進行比較,以及
基于一組優先級規則和使用規則,將來自被認為是最可靠和可用的源的數據選擇為有效。
9.根據權利要求1所述的系統,還包括處理器,所述處理器被配置成對來自不同搜索目標的相關數據進行管理、評判、合成和聚類,以形成聚類數據記錄。
10.根據權利要求9所述的系統,其中,所述處理器被配置成根據所述聚類數據記錄來生成復合數據記錄。
11.一種用于搜索與查詢有關的數據的方法,包括:
檢查在初始搜索目標的集合中發現的數據;
在存儲裝置中存儲來自所述初始搜索目標的:(a)與所述查詢有關的數據和元數據中的至少一個,以及(b)指定要搜索的附加搜索目標的數據和元數據中的至少一個;
對所述附加搜索目標進行搜索,以找到:(a)與所述查詢有關的數據和元數據中的至少一個,以及(c)指定要搜索的另外的搜索目標的數據和元數據中的至少一個;以及
在所述存儲裝置中存儲來自所述另外的搜索目標的:(a)與所述查詢有關的數據和元數據中的至少一個,以及(c)指定所述另外的搜索目標的數據和元數據中的至少一個。
12.根據權利要求11所述的方法,其中,當所述附加搜索目標被搜索時,如果另外的目標被發現,則所述方法還包括:
使用(c)指定所述另外的搜索目標的數據和元數據中的至少一個來訪問所述另外的目標;以及
在所述存儲裝置中存儲來自所述另外的搜索目標的:(a)與所述查詢有關的數據和元數據中的至少一個,以及(d)指定要搜索的其他搜索目標的數據和元數據中的至少一個。
13.根據權利要求11所述的方法,其中,當附加搜索目標被搜索并且指定另外的搜索目標的數據和元數據中的至少一個被發現時,所述方法在對所述另外的搜索目標的搜索不再產生要搜索的搜索目標時終止。
14.根據權利要求11所述的方法,其中,搜索引擎被配置成搜索網站或其他源,并且所述種子源的列表是所述網站或其他源的列表。
15.根據權利要求11所述的方法,還包括對從搜索目標獲得的數據進行凈化。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于鄧白氏公司,未經鄧白氏公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201380052519.8/1.html,轉載請聲明來源鉆瓜專利網。





