[發(fā)明專(zhuān)利]一種基于最優(yōu)混合估值的大壩安全監(jiān)測(cè)數(shù)據(jù)補(bǔ)全方法在審
| 申請(qǐng)?zhí)枺?/td> | 202110242719.6 | 申請(qǐng)日: | 2021-03-05 |
| 公開(kāi)(公告)號(hào): | CN113139570A | 公開(kāi)(公告)日: | 2021-07-20 |
| 發(fā)明(設(shè)計(jì))人: | 朱思敏;呂鑫;遲福東;彭欣欣;余意;廖貴能;陳豪;王順波;吳光耀 | 申請(qǐng)(專(zhuān)利權(quán))人: | 河海大學(xué);華能瀾滄江水電股份有限公司;華能集團(tuán)技術(shù)創(chuàng)新中心有限公司 |
| 主分類(lèi)號(hào): | G06K9/62 | 分類(lèi)號(hào): | G06K9/62 |
| 代理公司: | 南京縱橫知識(shí)產(chǎn)權(quán)代理有限公司 32224 | 代理人: | 張賞 |
| 地址: | 211100 江*** | 國(guó)省代碼: | 江蘇;32 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 最優(yōu) 混合 大壩 安全 監(jiān)測(cè) 數(shù)據(jù) 方法 | ||
本發(fā)明公開(kāi)了一種基于最優(yōu)混合估值的大壩安全監(jiān)測(cè)數(shù)據(jù)補(bǔ)全方法,包括,將大壩安全監(jiān)測(cè)數(shù)據(jù)集劃分為訓(xùn)練集和測(cè)試集,其中,訓(xùn)練集為完整子數(shù)據(jù)集,測(cè)試集為缺失子數(shù)據(jù)集;基于訓(xùn)練集采用XgBoost算法構(gòu)建最優(yōu)預(yù)測(cè)模型;采用最優(yōu)預(yù)測(cè)模型對(duì)測(cè)試集中各數(shù)據(jù)所屬類(lèi)的概率分布進(jìn)行預(yù)測(cè),生成測(cè)試集樣本概率向量;基于測(cè)試集樣本概率向量進(jìn)行聚類(lèi);對(duì)于連續(xù)型數(shù)據(jù)存在缺失,則用所屬類(lèi)中對(duì)應(yīng)特征屬性的均值來(lái)補(bǔ)全數(shù)據(jù);對(duì)于離散型數(shù)據(jù)缺失,則將該條數(shù)據(jù)所屬類(lèi)的極大似然估計(jì)作為補(bǔ)全數(shù)據(jù)。本發(fā)明方法解決了混合數(shù)據(jù)集中各類(lèi)數(shù)據(jù)缺失的問(wèn)題,可對(duì)大壩安全監(jiān)測(cè)數(shù)據(jù)集的特征進(jìn)行有效評(píng)估,具有更強(qiáng)的泛化能力和更精確的補(bǔ)全效果。
技術(shù)領(lǐng)域
本發(fā)明涉及一種基于最優(yōu)混合估值的大壩安全監(jiān)測(cè)數(shù)據(jù)補(bǔ)全方法,屬于數(shù)據(jù)補(bǔ)全技術(shù)領(lǐng)域。
背景技術(shù)
隨著數(shù)據(jù)采集和存儲(chǔ)能力的高速發(fā)展,為了提高挖掘可靠信息的效率,對(duì)缺失數(shù)據(jù)補(bǔ)全的技術(shù)越來(lái)越受關(guān)注。Gao等人提出基于最小二乘法支持向量機(jī)的歸并算法,并采用粒子群算法搜索參數(shù)的最優(yōu)值,通過(guò)節(jié)點(diǎn)的以往數(shù)據(jù)和鄰居節(jié)點(diǎn)數(shù)據(jù)共同對(duì)數(shù)據(jù)進(jìn)行估計(jì),解決了核電站輻射監(jiān)控?cái)?shù)據(jù)的缺失問(wèn)題,然而這個(gè)算法的局限是只有在缺失數(shù)據(jù)與有效數(shù)據(jù)之間存在高度相關(guān)時(shí),才具有較好的預(yù)測(cè)精度。Bertini等人利用完全二部屬性決策圖來(lái)估計(jì)缺失值,該模型可以在考慮所有描述數(shù)據(jù)的屬性的情況下,找到丟失屬性值的適當(dāng)間隔。實(shí)際中該方法需要數(shù)據(jù)的屬性標(biāo)簽盡量完整,不適用于在噪聲較多的數(shù)據(jù)集。He等人基于深度學(xué)習(xí)的框架重建缺失的數(shù)據(jù),以利于時(shí)間序列的分析。但是,這類(lèi)所提方法并不能夠處理混合分類(lèi)連續(xù)缺失等問(wèn)題。
發(fā)明內(nèi)容
本發(fā)明所要解決的技術(shù)問(wèn)題是克服現(xiàn)有技術(shù)的缺陷,提供一種基于最優(yōu)混合估值的大壩安全監(jiān)測(cè)數(shù)據(jù)補(bǔ)全方法,
為解決上述技術(shù)問(wèn)題,本發(fā)明采用的技術(shù)方案如下:
本發(fā)明提供一種基于最優(yōu)混合估值的大壩安全監(jiān)測(cè)數(shù)據(jù)補(bǔ)全方法,包括:
將大壩安全監(jiān)測(cè)數(shù)據(jù)集劃分為訓(xùn)練集和測(cè)試集;所述大壩安全監(jiān)測(cè)數(shù)據(jù)集中每條數(shù)據(jù)由多個(gè)特征屬性和一個(gè)類(lèi)標(biāo)簽構(gòu)成;
基于訓(xùn)練集構(gòu)建最優(yōu)預(yù)測(cè)模型,預(yù)測(cè)樣本所屬各個(gè)類(lèi)的概率分布;
采用最優(yōu)預(yù)測(cè)模型對(duì)測(cè)試集中各數(shù)據(jù)所屬類(lèi)的概率分布進(jìn)行預(yù)測(cè),生成測(cè)試集樣本概率向量;
基于測(cè)試集樣本概率向量進(jìn)行聚類(lèi);
基于聚類(lèi)結(jié)果和缺失數(shù)據(jù)類(lèi)型對(duì)測(cè)試集中缺失數(shù)據(jù)進(jìn)行補(bǔ)全。
進(jìn)一步的,所述將大壩安全監(jiān)測(cè)數(shù)據(jù)集劃分為訓(xùn)練集和測(cè)試集,包括:
將大壩安全監(jiān)測(cè)數(shù)據(jù)集分為完整子數(shù)據(jù)集和非完整子數(shù)據(jù)集,將完整子數(shù)據(jù)集作為訓(xùn)練集,非完整子數(shù)據(jù)集作為測(cè)試集;
所述非完整子數(shù)據(jù)集是指,如果一條數(shù)據(jù)的某些特征屬性或類(lèi)標(biāo)簽缺失,則該條數(shù)據(jù)被分為非完整子數(shù)據(jù)集。
進(jìn)一步的,所述基于訓(xùn)練集構(gòu)建最優(yōu)預(yù)測(cè)模型,預(yù)測(cè)樣本所屬各個(gè)類(lèi)的概率分布,包括,
建立XgBoost預(yù)測(cè)模型:
采用訓(xùn)練集對(duì)所述XgBoost預(yù)測(cè)模型進(jìn)行訓(xùn)練,得到最優(yōu)XgBoost預(yù)測(cè)模型。
進(jìn)一步的,在訓(xùn)練過(guò)程中,采用貪心調(diào)參法,對(duì)XgBoost預(yù)測(cè)模型參數(shù)先粗調(diào)后再精調(diào);通過(guò)粗調(diào)得出參數(shù)最優(yōu)取值范圍,精調(diào)采用縮小步長(zhǎng)的方法,在最優(yōu)取值范圍內(nèi)找到最優(yōu)的參數(shù)值,從而得出最優(yōu)XgBoost預(yù)測(cè)模型。
進(jìn)一步的,所述采用最優(yōu)預(yù)測(cè)模型對(duì)測(cè)試集中各數(shù)據(jù)所屬類(lèi)的概率分布進(jìn)行預(yù)測(cè),生成測(cè)試集樣本概率向量,包括,
將測(cè)試集放入最優(yōu)XgBoost預(yù)測(cè)模型中,得出測(cè)試集中每個(gè)樣本所屬各個(gè)類(lèi)的概率分布;
將測(cè)試集中各個(gè)樣本所屬類(lèi)的概率值轉(zhuǎn)化為測(cè)試集樣本概率向量。
該專(zhuān)利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專(zhuān)利權(quán)人授權(quán)。該專(zhuān)利全部權(quán)利屬于河海大學(xué);華能瀾滄江水電股份有限公司;華能集團(tuán)技術(shù)創(chuàng)新中心有限公司,未經(jīng)河海大學(xué);華能瀾滄江水電股份有限公司;華能集團(tuán)技術(shù)創(chuàng)新中心有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買(mǎi)此專(zhuān)利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110242719.6/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專(zhuān)利網(wǎng)。
- 同類(lèi)專(zhuān)利
- 專(zhuān)利分類(lèi)
G06K 數(shù)據(jù)識(shí)別;數(shù)據(jù)表示;記錄載體;記錄載體的處理
G06K9-00 用于閱讀或識(shí)別印刷或書(shū)寫(xiě)字符或者用于識(shí)別圖形,例如,指紋的方法或裝置
G06K9-03 .錯(cuò)誤的檢測(cè)或校正,例如,用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標(biāo)記或含有代碼標(biāo)記的打印字符的,例如,由不同形狀的各個(gè)筆畫(huà)組成的,而且每個(gè)筆畫(huà)表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理,即無(wú)須判定關(guān)于圖像的同一性而進(jìn)行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合
- 判別大壩穩(wěn)定性的位移監(jiān)測(cè)方法
- 一種大壩上游面輔助防滲結(jié)構(gòu)
- 基于互聯(lián)網(wǎng)遠(yuǎn)程管理的大壩強(qiáng)震動(dòng)安全監(jiān)測(cè)與預(yù)警系統(tǒng)
- 可永久調(diào)控混凝土大壩溫度的方法及裝置
- 一種防滲止水的大壩基礎(chǔ)
- 一種基于北斗通信的大壩群管理系統(tǒng)
- 病險(xiǎn)水庫(kù)大壩重建工程近距離布置新老混凝土壩及方法
- 一種大壩上游面防滲結(jié)構(gòu)
- 一種基于大壩安全監(jiān)測(cè)成果的水電站大壩安全管理成效積分動(dòng)態(tài)計(jì)算方法
- 病險(xiǎn)水庫(kù)大壩重建工程近距離布置新老混凝土壩





