[發明專利]一種基于滑動窗口的尾礦砂液化數據聚類方法在審
| 申請號: | 202110594285.6 | 申請日: | 2021-05-28 |
| 公開(公告)號: | CN113191089A | 公開(公告)日: | 2021-07-30 |
| 發明(設計)人: | 呂伏;王鑫磊;馮永安 | 申請(專利權)人: | 遼寧工程技術大學 |
| 主分類號: | G06F30/27 | 分類號: | G06F30/27;G06K9/62 |
| 代理公司: | 大連東方專利代理有限責任公司 21212 | 代理人: | 李洪福 |
| 地址: | 123000*** | 國省代碼: | 遼寧;21 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 滑動 窗口 尾礦 液化 數據 方法 | ||
1.一種基于滑動窗口的尾礦砂液化數據聚類方法,其特征在于,包括如下步驟:
S1:對尾礦砂液化數據進行標準化處理,得到標準化數據集;
S2:滑動窗口模型遍歷所述標準化數據集,并計算每個滑動窗口內標準化數據的標準差,所有標準差形成標準差數據集;
S3:計算標準差數據集的均值和標準差,根據所述標準差數據集的均值和標準差和拉依達準則得到多個分段數據集;
S4:計算每個所述分段數據集的聚類半徑;
S5:每個所述分段數據集根據其所述聚類半徑和聚類算法進行聚類;
S6:將不在任何簇中的數據作為異常點輸出。
2.根據權利要求1所述的一種基于滑動窗口的尾礦砂液化數據聚類方法,其特征在于,在所述步驟S1中,采用Z-score標準化方法對所述尾礦砂液化數據進行標準化處理。
3.根據權利要求2所述的一種基于滑動窗口的尾礦砂液化數據聚類方法,其特征在于,Z-score標準化方法計算方式如下:
其中data為標準化數據,data_old為原始數據,data_val為原始數據的均值,data_std為原始數據的標準差。
4.根據權利要求1所述的一種基于滑動窗口的尾礦砂液化數據聚類方法,其特征在于,在所述步驟S5中所述聚類算法為DBSCAN算法。
5.根據權利要求1所述的種基于滑動窗口的聚類算法用于尾礦砂液化數據研究,其特征在于,在所述步驟S2中滑動窗口內標準化數據的標準差的計算方式如下:
所述標準化數據集X的樣本數量為N,xi表示所述標準化數據集X中的第i個樣本;
所述滑動窗口模型的滑動窗口的窗口大小為n;
W為所述滑動窗口,wj表示第j個滑動窗口;所述滑動窗口的數量為N-n-1;
計算所述滑動窗口內數據的標準差,所述標準差數據集其中,μj為第j個滑動窗口內數據的均值,σj為第j個滑動窗口內標準化數據的標準差。
6.根據權利要求5所述的種基于滑動窗口的聚類算法用于尾礦砂液化數據研究,其特征在于,在所述步驟S3中標準差數據集的均值和標準差的計算方式如下:
式中,μ為標準差數據集的均值;σ為標準差數據集的標準差。
7.根據權利要求5所述的種基于滑動窗口的聚類算法用于尾礦砂液化數據研究,其特征在于,在所述步驟S3中所述分段數據集的獲得方式包括:
所述標準差數據集的均值μ和標準差σ,根據所述拉依達準則,所述標準差數據集S的正常數據分布在μ±3σ區間范圍內,未在μ±3σ區間范圍內的數據定義為非正常數據,標準差數據集內的數據與μ±3σ線的交點作為數據分段點,相臨兩個所述分段點之間的數據形成所述分段數據集。
8.根據權利要求1所述的種基于滑動窗口的聚類算法用于尾礦砂液化數據研究,其特征在于,所述分段數據集的聚類半徑計算方式如下:
計算每一所述分段數據集中兩兩元素之間的距離,得到元素距離表dist;
dist={d(a1,a2),(a1,a3),…,(ap,aq)}(p=1,2,…n;q=1,2,…n;p≠q);
其中a為所述分段數據集中元素,d為兩元素之間的距離;
元素距離表中的數據按照從小到大的順序對依次排列,為了保證精度,根據數據規模選擇不超過20%的數據,對選取的數據求平均值得到所述聚類半徑,當所述聚類半徑≥0.2時,取所述聚類半徑=0.2。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于遼寧工程技術大學,未經遼寧工程技術大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110594285.6/1.html,轉載請聲明來源鉆瓜專利網。





