[發明專利]基于樣本相似性排序建模實時評估系統狀態的方法無效
| 申請號: | 201310407396.7 | 申請日: | 2013-09-10 |
| 公開(公告)號: | CN103440537A | 公開(公告)日: | 2013-12-11 |
| 發明(設計)人: | 周偉寧;陳言;羅林發 | 申請(專利權)人: | 上海白丁電子科技有限公司 |
| 主分類號: | G06Q10/04 | 分類號: | G06Q10/04;G06Q50/06 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 201206 上海市浦*** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 樣本 相似性 排序 建模 實時 評估 系統 狀態 方法 | ||
技術領域
?本發明涉及模式識別、軟件開發領域,主要應用于發電站、化工工業等監控預警領域。
背景技術
隨著20世紀40年代計算機的出現以及50年代人工智能的興起,人們希望用計算機來代替或擴展人類的部分腦力勞動。
伴隨著各種隨身設備、互聯網和云計算、云存儲等技術的發展,在工廠設備的計算機自動監控系統中,所有的數據都可以被記錄,包括設備本身的技術數據、設備運行的軌跡數據、設備工作時的環境數據等,數據的收集呈現出大爆炸的狀態。如何挖掘利用這些海量的數據,面臨著技術上的挑戰。
從使用的角度來看,大數據還面臨其他因素的挑戰。由于各種數據的準確性不能夠直觀地得出,會導致數據價值大大降低。在工業設備實時數據采集的過程中,一些無法確定的因素也影響了數據的準確性。
由此計算機模式識別在20世紀60年代初迅速發展并成為一門新學科。模式識別(Pattern?Recognition)是指對表征事物或現象的各種形式(數值、文字和邏輯關系)的信息進行處理和分析,以對事物或現象進行描述、辨認、分類和解釋的過程,是信息科學和人工智能的重要組成部分。模式識別又常稱作模式分類,從處理問題的性質和解決問題的方法等角度,模式識別分為有監督的分類(Supervised?Classification)和無監督的分類(Unsupervised?Classification)兩種。二者的主要差別在于,各實驗樣本所屬的類別是否預先已知。一般說來,有監督的分類往往需要提供大量已知類別的樣本,但在實際操作過程中,存在一定困難的。
當模式識別、大數據處理等技術主要應用于發電站、化工工業等監控預警領域時,樣本數量的大小將會直接影響模型對實時系統評估的魯棒性,同時對模型估計的精確度、靈敏度也有相當的影響,因此對于樣本如何壓縮提取,很多方法難以在顧及魯棒性的同時考慮模型的精確度、靈敏度。
發明內容
為解決上述問題,本發明公開一種基于樣本相似性排序建模實時評估系統狀態的方法,即從動態系統隨時間進行而產生的實時狀態數據中選取正常狀態時的數據;基于相似性距離排序方法對正常狀態樣本數據進行排序,并選取符合條件的樣本數據組成正常狀態樣本數據庫;將動態系統中任一時間點產生的一組數據與樣本庫中的每一個樣本進行相似性計算,產生一組相似權重值;根據相似權重值及系統狀態確定規則,評估在此時間點該系統的狀態。
一般從實際情況取出的正常狀態樣本數量N,比建立狀態樣本數據庫所需要的樣本數量M多很多,因而選取數據的方案對最后系統狀態評估有很大的影響,故本發明涉及的基于樣本相似性排序建模實時評估系統狀態的方法,根據魯棒性、精確性的要求確定模型中正常狀態下的樣本數量。
本發明所涉及的基于樣本相似性排序建模實時評估系統狀態的方法,采用以下步驟來解決背景技術中存在的技術問題:
1、確定取數的數量。在實時狀態數據中,選取樣本數量在狀態向量變量數的3倍至4倍區間;其中所述狀態向量變量數為需要監測的參數點的數據,如此確定的樣本數量可以使相似性建模評估系統狀態時,魯棒性靈敏度相對折中,評估值準確性高。
2、由于樣本空間中每一變量數量級不同,變化范圍也不同,所以要將樣本向量進行歸一化處理。比如將向量X=[,,…]中各數值進行歸一化,歸一化后的值重新賦值給X,X=[,,…]。數據歸一化處理方式有:
(1)、可以將每一變量的所有值相加,將此和值作為1處理,每一變量歸一化后的值為該值除以和值。
,,,···
(2)、也可以在每一變量中取最大值為1,最小值為0,變量其他值為在此變量排序中相距最大最小值的距離決定。
,;
,,,···
3、將樣本向量通過相似性距離進行排序。
相似性距離可以用以下距離公式計算:
(設兩個向量為X=(x1,…,xn),Y=(y1,…yn)):
(3)歐氏距離:??
?
(4)泊松相關性相似距離:
(5)向量夾角距離:
。
4、樣本向量依據相似性大小排序后,取第一個與最后一個樣本向量作為正常狀態數據庫的兩個向量。
其中設正常狀態樣本數量為N,取第一個與最后一個樣本向量作為正常狀態數據庫的兩個向量,余下N-2個向量;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于上海白丁電子科技有限公司,未經上海白丁電子科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201310407396.7/2.html,轉載請聲明來源鉆瓜專利網。
- 同類專利
- 專利分類
G06Q 專門適用于行政、商業、金融、管理、監督或預測目的的數據處理系統或方法;其他類目不包含的專門適用于行政、商業、金融、管理、監督或預測目的的處理系統或方法
G06Q10-00 行政;管理
G06Q10-02 .預定,例如用于門票、服務或事件的
G06Q10-04 .預測或優化,例如線性規劃、“旅行商問題”或“下料問題”
G06Q10-06 .資源、工作流、人員或項目管理,例如組織、規劃、調度或分配時間、人員或機器資源;企業規劃;組織模型
G06Q10-08 .物流,例如倉儲、裝貨、配送或運輸;存貨或庫存管理,例如訂貨、采購或平衡訂單
G06Q10-10 .辦公自動化,例如電子郵件或群件的計算機輔助管理





