[發明專利]根據可視反饋自動調整值序列分析任務的方法和系統有效
| 申請號: | 201310563640.9 | 申請日: | 2013-11-14 |
| 公開(公告)號: | CN103823667A | 公開(公告)日: | 2014-05-28 |
| 發明(設計)人: | P·龐佩;O·費舒爾;M·沃斯特 | 申請(專利權)人: | 國際商業機器公司 |
| 主分類號: | G06F9/44 | 分類號: | G06F9/44;G06F17/30 |
| 代理公司: | 北京市中咨律師事務所 11247 | 代理人: | 于靜;張亞非 |
| 地址: | 美國*** | 國省代碼: | 美國;US |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 根據 可視 反饋 自動 調整 序列 分析 任務 方法 系統 | ||
技術領域
本公開涉及用于預處理值序列(value?series)數據的方法,值序列數據包含時間序列數據,以便選擇適當的分析方法并調整參數。
背景技術
選擇正確的分析方法并且適當地調整其參數是進行有用的分析應用的先決條件。對于時間或值序列的分析尤為如此。調整和選擇正確的分析方法一方面需要統計專業知識以便理解方法及其調整過程,而另一方面需要領域專業知識以便解釋數據并且理解感興趣的任務。統計分析通常對于領域專家而言難以理解和使用,而統計人員則浪費時間來獲得用于解決感興趣的任務的必需領域專業知識。
一個典型的實例是對從傳感器數據獲得的時間序列進行降噪。這些序列可以展現任何事物,從添加到實際信號的隨機噪聲到極值或完全的傳感器故障。
存在許多已知的方法以便過濾噪聲并且從數據中刪除異常值。簡單的實例是基于移動平均的平滑算法、基于樣條的方法,或者諸如低通濾波器之類的過濾技術。
這些方法具有挑戰。
●設置參數并非易事,其通常需要例如關于傳感器屬性的大量背景知識。在大量多種多樣并且高度可調整的方法中選擇最佳降噪方法需要統計上的專業知識。
●“正確的”過濾參數可以隨時間改變,甚至可能頻繁改變。例如,傳感器可以在白天和夜間展現不同的屬性。
●搜索空間可以很大,這從計算復雜性和統計顯著性的角度產生挑戰。
由于這些原因,預處理大量時間序列以便分析仍是一項工作非常密集的任務,需要有關過濾器屬性和原始數據分布的淵博統計知識。
與此相反,一種改進的方法將:
●足夠簡單以便專家無需太多的統計知識即可使用;
●將交互量降至最低;以及
●允許將方法細粒度地應用于單個或一組序列。
現有技術通過試錯方法執行該操作,其中專家測試不同的方法和參數以調整這些方法以便查找最合適的方法。但是,這種方法可能需要大量手動工作并且容易出錯。
如果給定監管式學習任務,則一種替代方案是將包裝器與進化計算一起使用以便優化該任務的參數。因為該優化的搜索空間可以很大,所以這些方法可能過度擬合并且具有高計算復雜性。此外,這些方法僅適用于監管式任務。還存在用于群集的半監管式學習方法,這些方法通常獲得實體對并且將它們標記為相似或不同。根據這點,可以獲知最佳參數和距離度量。雖然這些方法可能非常適合于某些數據集,但它們通常需要許多標記的對,并且依賴良好的現有特性,這些特性通常不可用于值序列。此外,這些方法通常針對群集進行調整并且不適用于分析值序列。最重要的是,與用戶的交互限于用戶提供的標簽,這限制了用戶和分析系統之間的交互。
發明內容
根據本發明的一個方面,提供一種用于針對值序列選擇分析過程的計算機實現的方法,包括:在計算機顯示器上顯示值序列;接收一個或多個由用戶提供的注釋序列,其中所述注釋覆蓋所述計算機顯示器上的所述值序列的至少一個子區間;使用所述用戶提供的注釋序列從一組值序列分析方法中選擇最佳值序列分析方法,其中選擇最佳值序列分析方法包括確定所述最佳值序列分析方法的參數值;以及向所述用戶呈現所選擇的最佳值序列分析方法和參數以及所述注釋序列的最佳重構。
根據本發明的進一步方面,所述方法包括:在向所述用戶呈現所選擇的最佳值序列分析方法之后,從所述用戶處接收用戶提供的附加注釋序列,以及從一組值序列分析方法中選擇最佳地重構所述用戶提供的注釋序列的另一最佳值序列分析方法。
根據本發明的進一步方面,所述方法包括:在所述計算機顯示器上顯示多個值序列,其中至少一個由用戶提供的注釋序列連接不同值序列中的點。
根據本發明的進一步方面,所述值序列是時間序列,并且還包括根據用戶提供的注釋序列將所述時間序列劃分為段。
根據本發明的進一步方面,選擇最佳地重構所述用戶提供的注釋序列的最佳值序列分析方法包括針對所述用戶注釋的段,確定最小化所述段中的時間序列點與所述用戶注釋之間的誤差的最佳過濾器。
根據本發明的進一步方面,選擇最佳地重構所述用戶提供的注釋序列的最佳值序列分析方法包括針對所述用戶未注釋的段,標識相似的已注釋的段,并且確定最小化所述未注釋的段與所述已注釋的段中的時間序列點之間的誤差的最佳過濾器。
根據本發明的進一步方面,根據所述未注釋的段和所述已注釋的段的方差和頻率分布而標識相似的已注釋的段。
根據本發明的進一步方面,根據由所述最佳過濾器過濾之前和之后的所述未注釋的段之間的誤差分布而標識相似的已注釋的段。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于國際商業機器公司,未經國際商業機器公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201310563640.9/2.html,轉載請聲明來源鉆瓜專利網。





