[發明專利]數據量的處理在審
| 申請號: | 201380028056.1 | 申請日: | 2013-03-25 |
| 公開(公告)號: | CN104321770A | 公開(公告)日: | 2015-01-28 |
| 發明(設計)人: | H.拉斯特;C.施特曼;S.H.韋伯 | 申請(專利權)人: | 西門子公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 中國專利代理(香港)有限公司 72001 | 代理人: | 杜荔南;劉春元 |
| 地址: | 德國*** | 國省代碼: | 德國;DE |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 數據量 處理 | ||
技術領域
本發明涉及用于處理(大)數據量、尤其是用于在數據量中找出至少一個命中項的方法以及裝置。
背景技術
信息技術隨著持續深入社會而產生巨大量的數據和信息。一個增長的挑戰是,使這些數據中的知識可用于不同應用。
應將數據挖掘(英語術語譬如是指“從數據山中提取譬如有價值的事物”)理解成將大多基于統計數學的方法系統地應用于數據存量,其目的是識別新的模式。在此,還涉及處理非常大的數據存量(其不再能人工地處理),為此需要有效的方法,該方法的時間復雜度使其適用于這樣的數據量。但是這些方法也應用于較小的數據量。在實際中,尤其是在德語語言使用中,盎格魯薩克森術語“數據挖掘”是為所謂的“Knowledge?Discovery?in?Databases”(數據庫中的知識發現,KDD)的整個過程設立的,該過程還包括諸如預處理的步驟(參見:http://de.wikipedia.org/wiki/Data-Mining)。
在實際中,數據挖掘常常喚起錯誤的期望,據此“感興趣的知識”應當自動地——即在沒有用戶的顯著貢獻的情況下——被提取。該方案也被稱為“Unsupervised?Machine?Learning”(譬如:沒有監視的機器學習)。
在最近幾十年中,研發出可以從大數據量中提取感興趣的部分方面的多種算法。但是可以自動被提取的“感興趣的知識”總是由諸如常用模式的相對簡單的方面、在數據中被搜索的特定群集和結構構成。對用算法提取的知識的品質的解釋和評估在于用戶。
另外需要與用戶的交互。例如,用于異常識別的算法需要預先定義正常行為或者由用戶提供正常數據。該方案也被稱為“Supervised?Machine?Learning”(譬如:受監視的機器學習)或“Active?Learning”(主動學習)。對數據挖掘系統的問題設置越復雜,則與用戶的交互就被構造得越詳細。
在此,存在用戶與機器之間的例如以有利的人機接口形式的合適通信能力的問題。
這是因為,在機器提取的信息與對人的可用物之間存在大的分歧:例如需要交互式地影響模型參數,以便逐漸地最大化可用知識的份額。恰恰具有復雜關聯的大數據量在此對系統的能力提出巨大的要求。
作為一種跨學科的方案已知有“視覺分析學”(VA),其將來自不同研究領域的優點相結合。視覺分析學方法的目標是,從大的和復雜的數據組中得到認識。該方案將自動數據分析的強項與人能快速地在視覺上收集模式和趨勢的能力相組合。通過合適的交互機制,數據可以被視覺探索并且可以獲得認識(參見http?:?//de.?wikipedia.?org/wiki/Visual_Analytics)。
已知VA系統的在圖形顯示上的交互基本上由選擇已經存在于數據中的感興趣的模式構成。在此,用戶被限制于已經存在的模式。更廣泛的靈活性未被提供給用戶。
發明內容
本發明的任務在于,避免前述缺點并且尤其是提供用于在大數據量中搜索信息的有效可能性。
該任務根據獨立權利要求的特征來解決。優選的實施方式尤其是可自從屬權利要求中得知。
為了解決該任務,說明了一種用于處理數據量、尤其是用于在大數據量中搜索命中項的方法;
-其中創建圖形搜索模式;
-其中該搜索模式被轉換成至少一個詢問;
-其中該詢問被應用于數據量。
該方案使得能夠基于交互式創建的、視覺的搜索詢問來進行自動化模式識別。因此,用戶可以選擇已存在的模式作為搜索模式或者根據已存在數據創建或修改搜索模式,或者在沒有樣品的情況下創建搜索模式并且根據其想象進行適配。圖形搜索模式為用戶提供了對復雜詢問結構的簡單訪問,用戶可容易地理解和修改所述復雜查詢結構。圖形模式在至少一個詢問中被翻譯并且被應用于數據量;因此找到基于圖形搜索模式的命中項。
在此應當注意,搜索模式的創建還可以包括修改現有數據或已存在的搜索模式。
一個改進方案是,通過圖形用戶界面來創建搜索模式。
圖形用戶界面例如可以包括圖形編輯器。
另一改進方案是,借助于二維或三維掃描儀和/或借助于至少一個相機來創建搜索模式。
例如,可以檢測用戶與機器的運動或交互,并且將其適當地轉換成對搜索模式的修改。因此,用戶可以借助于相機和/或借助于掃描儀視覺地修改數據并且因此將圖形搜索模式與其想象相應地匹配。
一個改進方案尤其是,基于數據量的數據或其它數據和/或基于至少一個其它搜索模式來創建搜索模式。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于西門子公司,未經西門子公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201380028056.1/2.html,轉載請聲明來源鉆瓜專利網。





