[發明專利]一種基于模型集群的工業大數據自主挖掘方法有效
| 申請號: | 202111168737.0 | 申請日: | 2021-09-30 |
| 公開(公告)號: | CN113868311B | 公開(公告)日: | 2022-08-23 |
| 發明(設計)人: | 胡紹林;郭其亮;張清華;謝國;文成林;陳文卓;雷高偉 | 申請(專利權)人: | 廣東石油化工學院 |
| 主分類號: | G06F16/2458 | 分類號: | G06F16/2458;G06N5/02;G06F17/18 |
| 代理公司: | 北京東方盛凡知識產權代理事務所(普通合伙) 11562 | 代理人: | 李娜 |
| 地址: | 525000 廣東省茂*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 模型 集群 工業 數據 自主 挖掘 方法 | ||
1.一種基于模型集群的工業大數據自主挖掘方法,其特征在于,包括以下步驟:
S1、基于領域知識,采用數據結構分析和特征分析構建模型集群;基于多源異構數據的結構特征,采用時序數據模態分解構建挖掘引擎;
S2、對所述多源異構數據進行采樣,并對采樣數據的隨機誤差方差進行容錯估計,所述采樣數據為工程數據倉庫中自動提取的時序數據序列;
S3、利用挖掘引擎對數據集進行挖掘,從工程數據倉庫中自動提取時序數據序列,采用多模態加性假定,將時序數據變化過程看成是主體變化分量、隨機擾動分量和異常變化分量三種模態的疊加;采用主體分量曲線容錯擬合方法,消除野值異常變化分量的影響,實現采樣數據中隨機擾動分量誤差方差的容錯估計;采用ψ-函數代入至所述挖掘引擎確定每個采樣數據序列的最優容錯模型和模型參數的最優容錯估計;
S4、利用所述最優容錯模型進行擬合優度統計量計算與VVA檢驗;
S5、模型按結構進行聚類,得到模型的聚類,基于所述模型的聚類對數據按模型進行聚類,得到數據模型表示與內涵知識。
2.根據權利要求1所述的基于模型集群的工業大數據自主挖掘方法,其特征在于,所述模型集群包括:時間序列分析模型類、回歸分析模型類、時變曲線擬合模型類和帶故障數據類間歇過程模型。
3.根據權利要求2所述的基于模型集群的工業大數據自主挖掘方法,其特征在于,所述挖掘引擎采用容錯型挖掘引擎。
4.根據權利要求3所述的基于模型集群的工業大數據自主挖掘方法,其特征在于,所述容錯型挖掘引擎的構建方法為:
選取四種模型類中的其中一種和數據集群中的數據集合,構建最小二乘挖掘引擎;
將重衰減型的積分函數代替最小二乘挖掘引擎中的最小二乘積分函數作為損失函數,得到容錯型挖掘引擎。
5.根據權利要求1所述的基于模型集群的工業大數據自主挖掘方法,其特征在于,所述VVA檢驗包括:將挖掘出的最優容錯模型進行校核,確認挖掘過程所采用模型集群的合理性;然后考察所述最優容錯模型的表達知識與數據之間的一致性,結合對所關聯數據集的擬合優度進行檢驗;最后,對挖掘模型進行知識確認的過程,通過模型確認,實現對挖掘模型和知識的認定。
6.根據權利要求2所述的基于模型集群的工業大數據自主挖掘方法,其特征在于,所述時間序列分析模型類包括:自回歸模型、滑動平均模型、自回歸滑動平均模型、帶周期自回歸滑動平均模型、受控自回歸模型。
7.根據權利要求2所述的基于模型集群的工業大數據自主挖掘方法,其特征在于,所述回歸分析模型類包括:線性回歸模型、非線性回歸模型和Logistic模型。
8.根據權利要求2所述的基于模型集群的工業大數據自主挖掘方法,其特征在于,所述時變曲線擬合模型類包括:多項式擬合模型、三角多項式擬合模型、周期遞進模型。
9.根據權利要求1所述的基于模型集群的工業大數據自主挖掘方法,其特征在于,所述S2包括:
在所述多源異構數據中自動提取時序數據序列;
采用多模態加性假定,將時序數據變化過程看成是主體變化分量、隨機擾動分量和異常變化分量三種模態的疊加;
采用主體分量曲線容錯擬合方法,消除異常變化分量的影響,得到采樣數據中隨機擾動分量誤差方差的容錯估計。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于廣東石油化工學院,未經廣東石油化工學院許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202111168737.0/1.html,轉載請聲明來源鉆瓜專利網。





