[發明專利]用于通過遠程應用的高效數據提取的方法和系統有效
| 申請號: | 201210265198.7 | 申請日: | 2012-07-27 |
| 公開(公告)號: | CN102968428A | 公開(公告)日: | 2013-03-13 |
| 發明(設計)人: | K.R.岡恩;V.默多克 | 申請(專利權)人: | 國際商業機器公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 北京市柳沈律師事務所 11105 | 代理人: | 黃小臨 |
| 地址: | 美國紐*** | 國省代碼: | 美國;US |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 用于 通過 遠程 應用 高效 數據 提取 方法 系統 | ||
技術領域
本發明的實施例一般涉及一種數據處理系統,更具體地說,涉及通過遠程應用從數據庫的高效數據提取。
背景技術
隨著放于網絡上的數據量的增加,諸如通過用于數據挖掘的數據提取來收集數據資料庫中的大量數據并識別所收集的數據中的模式(pattern)已變得更加普遍。通過應用服務器對提供數據資料庫的數據庫的數據提取需要從應用服務器處的數據提取應用向數據庫發送查詢,并且解釋從數據庫向數據提取應用發送回的結果。由于去往數據庫的數據查詢以及從數據庫的數據的返回造成的延遲,從應用服務器對數據庫的數據庫調用(call)對于數據提取應用帶來性能損失(cost)。此外,由于因數據庫處理來自數據提取應用的眾多查詢而引入的延遲,從應用服務器對數據庫的數據庫調用對于數據庫的任何其他用戶帶來性能損失。
發明內容
有鑒于上述,存在對于一種用于減少從數據提取應用向提供數據資料庫的數據庫發送的查詢的數目、同時維持數據提取應用性能和精確度的方法、系統和程序的需要。
一個實施例提供了一種用于減少由應用向數據庫發送的查詢的數目的方法。該方法響應于檢測到數據提取應用準備針對至少一個數據提取規則來查詢數據庫,而訪問包括與新添加到數據庫的數據相關的信息的高速緩沖存儲器。在數據處理應用將從每個新數據事件解析的數據添加到數據庫之前,該信息被添加到用于每個新數據事件的高速緩沖存儲器。所述方法相對于高速緩沖存儲器中的信息來評估每個數據提取規則,以確定該信息是否與至少一個數據提取規則相關。所述方法僅針對與該信息相關的任何特定數據提取規則通過數據提取應用向數據庫發送單獨的查詢。
本發明的另一個實施例包括一種用于減少由應用向數據庫發送的查詢的數目的系統。該系統包括在至少一個處理器和存儲器上操作的查詢控制器。該查詢控制器操作以響應于檢測到數據提取應用準備針對至少一個數據提取規則來查詢數據庫,而訪問包括與新添加到數據庫的數據相關的信息的高速緩沖存儲器。該查詢控制器操作以相對于高速緩沖存儲器中的信息來評估每個數據提取規則,以確定該信息是否與至少一個數據提取規則相關。所述查詢控制器僅針對與該信息相關的任何特定數據提取規則通過數據提取應用向數據庫發送單個查詢。
本發明的另一個實施例包括一種用于減少由應用向數據庫發送的查詢的數目的計算機程序產品。該計算機程序產品包括一個或多個計算機可讀的有形存儲設備。此外,該計算機程序產品包括存儲在一個或多個存儲設備中的至少一個上的程序指令,用于響應于檢測到數據提取應用準備針對至少一個數據提取規則查詢數據庫,而訪問包括與新添加到數據庫的數據相關的信息的高速緩沖存儲器。該計算機程序產品包括存儲在一個或多個存儲設備中的至少一個上的程序指令,用于相對于高速緩沖存儲器中的信息來評估每個數據提取規則,以確定該信息是否與至少一個數據提取規則相關。該計算機程序產品包括存儲在一個或多個存儲設備中的至少一個上的程序指令,用于僅針對與該信息相關的任何特定數據提取規則通過數據提取應用向數據庫發送單獨的查詢。
本發明的另一個實施例提供一種用于管理關于添加到數據庫的數據的信息的方法。數據處理應用接收新數據事件。數據處理應用解析新數據事件以識別至少一個所解析的元素。數據處理應用對于每個所解析的元素確定該所解析的元素是否被指定為至少一個數據提取規則中的感興趣元素,所述至少一個數據提取規則是針對基于所述至少一個數據提取規則對于數據庫查詢數據的至少一個數據提取應用而指定的。對于被指定為感興趣元素的每個所解析的元素,數據處理應用為所解析的元素調用數據提取處理機以向高速緩沖存儲器添加關于所解析的元素的信息,并為所解析的元素調用默認處理機以向數據庫添加關于所解析的元素的數據。對于未被指定為至少一個數據提取規則中的至少一個感興趣元素的每個所解析的元素,數據處理應用為所解析的元素調用默認處理機以向數據庫添加關于所解析的元素的數據。與數據提取應用共享對高速緩沖存儲器中的信息的訪問,以使得數據提取應用可以對于每個查詢時段來確定任何數據提取規則是否需要關于存儲在數據庫中的新數據基于在高速緩沖存儲器中共享的信息而被重新評估。
附圖說明
在所附權利要求中闡述了認為是本發明的一個或多個實施例的特征的新穎特性。然而,當結合附圖來閱讀說明性實施例時,參考說明性實施例的下面具體說明將最好地理解發明自身的一個或多個實施例,在附圖中:
圖1圖示其中可以實現本發明的、包括用于向數據庫發送查詢的至少一個數據提取應用的系統架構;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于國際商業機器公司,未經國際商業機器公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201210265198.7/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:穿刺線夾
- 下一篇:全向短波高增益天線陣





