[發(fā)明專利]一種多類別集工業(yè)過(guò)程數(shù)據(jù)相似度多維度分析方法在審
| 申請(qǐng)?zhí)枺?/td> | 201810272536.7 | 申請(qǐng)日: | 2018-03-29 |
| 公開(公告)號(hào): | CN108536785A | 公開(公告)日: | 2018-09-14 |
| 發(fā)明(設(shè)計(jì))人: | 陳新碧 | 申請(qǐng)(專利權(quán))人: | 重慶沐信潤(rùn)喆網(wǎng)絡(luò)科技有限公司 |
| 主分類號(hào): | G06F17/30 | 分類號(hào): | G06F17/30 |
| 代理公司: | 暫無(wú)信息 | 代理人: | 暫無(wú)信息 |
| 地址: | 402260 重慶市江津區(qū)雙福街道*** | 國(guó)省代碼: | 重慶;50 |
| 權(quán)利要求書: | 查看更多 | 說(shuō)明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 相似度分析 數(shù)據(jù)集 相似度 工業(yè)過(guò)程數(shù)據(jù) 多維度分析 預(yù)處理 實(shí)際數(shù)據(jù) 數(shù)據(jù)集中 數(shù)據(jù)特征 數(shù)據(jù)維度 研究系統(tǒng) 運(yùn)行狀態(tài) 數(shù)值表 維度 隱含 抽取 檢索 采集 挖掘 分析 | ||
一種多類別集工業(yè)過(guò)程數(shù)據(jù)相似度多維度分析方法,具體步驟為:1)設(shè)定類別集;2)采集實(shí)際數(shù)據(jù),并進(jìn)行預(yù)處理;3)形成若干數(shù)據(jù)集;4)從每個(gè)數(shù)據(jù)集中抽取部分?jǐn)?shù)據(jù)并做標(biāo)記,作為該數(shù)據(jù)集的代表數(shù)據(jù);5)針對(duì)每個(gè)數(shù)據(jù)集的代表數(shù)據(jù),進(jìn)行不同維度的相似度分析,生成相似度數(shù)值表。本發(fā)明針對(duì)不同的數(shù)據(jù)維度,對(duì)部分?jǐn)?shù)據(jù)特征進(jìn)行相似度分析,從而實(shí)現(xiàn)對(duì)不同類別集的數(shù)據(jù)進(jìn)行相似度分析,來(lái)找出各類別集之間存在的隱含聯(lián)系,研究系統(tǒng)中產(chǎn)生不同運(yùn)行狀態(tài)的原因,以便于數(shù)據(jù)的挖掘、檢索與分析,尋找工況產(chǎn)生的原因。
技術(shù)領(lǐng)域
本發(fā)明涉及一種數(shù)據(jù)相似度分析技術(shù)領(lǐng)域,特別是一種多類別集工業(yè)過(guò)程的數(shù)據(jù)相似度多維度分析方法。
背景技術(shù)
目前,數(shù)據(jù)挖掘在工業(yè)數(shù)據(jù)中的應(yīng)用相當(dāng)流行,相似度分析方法是數(shù)據(jù)挖掘分析中的一種重要的手段。面對(duì)海量的工業(yè)過(guò)程數(shù)據(jù),如何從中挖取對(duì)工業(yè)系統(tǒng)的分析有價(jià)值的數(shù)據(jù),一直是對(duì)工業(yè)過(guò)程數(shù)據(jù)分析的重要目的。在工業(yè)過(guò)程數(shù)據(jù)的挖掘中,一般的方法都是從數(shù)據(jù)整體來(lái)進(jìn)行研究,通過(guò)對(duì)海量數(shù)據(jù)進(jìn)行聚類分類等處理,從得到的數(shù)據(jù)類別來(lái)分析系統(tǒng)可能的運(yùn)行狀態(tài)、檢測(cè)異常。一般的研究重點(diǎn)都放在了具有高度相似的同類別數(shù)據(jù)集中,而不同類別之間的相似度難以計(jì)算與分析。
發(fā)明內(nèi)容
本發(fā)明的目的就是提供一種多類別集工業(yè)過(guò)程數(shù)據(jù)相似度多維度分析方法,通過(guò)對(duì)不同類別集的數(shù)據(jù)在不同的維度下,進(jìn)行相似度分析,來(lái)找出各類別集之間存在的隱含聯(lián)系。
本發(fā)明的目的是通過(guò)這樣的技術(shù)方案實(shí)現(xiàn)的,具體步驟如下:
1)根據(jù)已有樣本數(shù)據(jù),設(shè)定類別集;
2)采集實(shí)際數(shù)據(jù),并對(duì)實(shí)際數(shù)據(jù)進(jìn)行預(yù)處理;
3)對(duì)步驟2)處理后的實(shí)際數(shù)據(jù),根據(jù)步驟1)設(shè)定的類別集進(jìn)行分類,形成若干數(shù)據(jù)集;
4)從步驟3)中的數(shù)據(jù)集抽取數(shù)據(jù),標(biāo)記數(shù)據(jù)來(lái)源,作為該類別集的代表數(shù)據(jù);
5)針對(duì)類別集中每個(gè)實(shí)際數(shù)據(jù)的特征,對(duì)該類別集中的代表數(shù)據(jù)進(jìn)行不同維度的相似度分析,形成相似度數(shù)值表;
6)從步驟3)中的數(shù)據(jù)集重新抽取數(shù)據(jù),標(biāo)記數(shù)據(jù)來(lái)源,作為該類別集的新的代表數(shù)據(jù),對(duì)該類別集中的新代表數(shù)據(jù)進(jìn)行不同維度的相似度分析,形成新的相似度數(shù)值表。
進(jìn)一步,步驟1)中所述設(shè)定類別集的具體方法為:
1-1)根據(jù)工業(yè)過(guò)程數(shù)據(jù)的屬性和特點(diǎn),設(shè)定數(shù)據(jù)的特征Xm;
1-2)利用監(jiān)督學(xué)習(xí)算法,對(duì)樣本數(shù)據(jù)按照數(shù)據(jù)特征進(jìn)行訓(xùn)練分類得到n個(gè)類別集。
進(jìn)一步,步驟2)中所述對(duì)實(shí)際數(shù)據(jù)進(jìn)行預(yù)處理的具體方法為:剔除掉野點(diǎn)數(shù)據(jù),并進(jìn)行歸一化處理。
進(jìn)一步,步驟3)中所述形成若干數(shù)據(jù)集的具體方法為:將實(shí)際數(shù)據(jù)與n個(gè)類別集進(jìn)行匹配,經(jīng)過(guò)多次迭代后,形成n個(gè)數(shù)據(jù)集。
進(jìn)一步,步驟4)中所述抽取數(shù)據(jù)的具體方法為:利用隨機(jī)抽樣的方法,從每個(gè)數(shù)據(jù)集中隨機(jī)抽取一組數(shù)據(jù),標(biāo)記數(shù)據(jù)所屬數(shù)據(jù)集,作為該數(shù)據(jù)集的代表數(shù)據(jù)。
進(jìn)一步,步驟5)中所述針對(duì)類別集中每個(gè)實(shí)際數(shù)據(jù)的特征,對(duì)該類別集中的代表數(shù)據(jù)進(jìn)行不同維度的相似度分析,形成相似度數(shù)值表的具體方法為:
5-1)把n個(gè)代表數(shù)據(jù)集進(jìn)行兩兩組合,將相似度閾值設(shè)為T;
5-2)對(duì)于每一個(gè)組合,針對(duì)其每一個(gè)數(shù)據(jù)特征進(jìn)行相似度分析,計(jì)算其相似度,對(duì)滿足相似度閾值的數(shù)據(jù)按其特征進(jìn)行組合,進(jìn)行高一維度分析,直到所有結(jié)果都不滿足相似度閾值;
5-3)用百分制的方法對(duì)每個(gè)數(shù)據(jù)特征的相似程度進(jìn)行計(jì)分,形成相似度數(shù)值表。
進(jìn)一步,步驟5-2)所述的相似度分析的具體方法為:
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于重慶沐信潤(rùn)喆網(wǎng)絡(luò)科技有限公司,未經(jīng)重慶沐信潤(rùn)喆網(wǎng)絡(luò)科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810272536.7/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06F 電數(shù)字?jǐn)?shù)據(jù)處理
G06F17-00 特別適用于特定功能的數(shù)字計(jì)算設(shè)備或數(shù)據(jù)處理設(shè)備或數(shù)據(jù)處理方法
G06F17-10 .復(fù)雜數(shù)學(xué)運(yùn)算的
G06F17-20 .處理自然語(yǔ)言數(shù)據(jù)的
G06F17-30 .信息檢索;及其數(shù)據(jù)庫(kù)結(jié)構(gòu)
G06F17-40 .數(shù)據(jù)的獲取和記錄
G06F17-50 .計(jì)算機(jī)輔助設(shè)計(jì)
- 數(shù)據(jù)集及數(shù)據(jù)集“異或”的DMA傳送
- 數(shù)據(jù)處理的方法和系統(tǒng)
- 鏈接數(shù)據(jù)集
- 數(shù)據(jù)處理方法及其設(shè)備
- VR視頻轉(zhuǎn)碼方法及裝置
- 數(shù)據(jù)匹配方法以及裝置
- 一種非平衡數(shù)據(jù)集的分類方法
- 處理數(shù)據(jù)的方法、裝置、電子設(shè)備及可讀存儲(chǔ)介質(zhì)
- 基于數(shù)據(jù)傾斜的關(guān)聯(lián)查詢方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 一種實(shí)體識(shí)別模型的建立方法、系統(tǒng)、電子設(shè)備及介質(zhì)
- 相似度計(jì)算設(shè)備、相似度計(jì)算方法及程序
- 組織相似度圖
- 相似度檢測(cè)裝置
- 圖像處理方法、裝置、計(jì)算機(jī)設(shè)備及存儲(chǔ)介質(zhì)
- 圖像處理方法、裝置、計(jì)算機(jī)設(shè)備及存儲(chǔ)介質(zhì)
- 相似度計(jì)算裝置、相似度計(jì)算方法以及相似度計(jì)算程序
- 一種蛋白質(zhì)相似度及相似蛋白質(zhì)的確定方法和系統(tǒng)
- 數(shù)據(jù)處理方法、數(shù)據(jù)處理設(shè)備及計(jì)算機(jī)存儲(chǔ)介質(zhì)
- 相似度確定方法和相似度確定裝置
- 文本相似度最佳閾值自動(dòng)尋找及優(yōu)化方法及裝置
- 工業(yè)現(xiàn)場(chǎng)設(shè)備的過(guò)程數(shù)據(jù)采集方法
- 一種工業(yè)能量計(jì)算系統(tǒng)
- 一種工業(yè)過(guò)程設(shè)備能量實(shí)時(shí)監(jiān)控系統(tǒng)及監(jiān)控方法
- 一種工業(yè)過(guò)程設(shè)備能量實(shí)時(shí)監(jiān)控系統(tǒng)
- 一種工業(yè)用能診斷分析系統(tǒng)及方法
- 工業(yè)過(guò)程網(wǎng)絡(luò)上的數(shù)據(jù)傳送
- 一種實(shí)時(shí)工業(yè)過(guò)程大數(shù)據(jù)壓縮存儲(chǔ)系統(tǒng)及方法
- 數(shù)據(jù)處理方法及系統(tǒng)
- 基于多模型遷移和BMA理論的復(fù)雜工業(yè)過(guò)程低成本建模方法
- 基于WGANs數(shù)據(jù)增強(qiáng)的非線性工業(yè)過(guò)程建模方法





