[發(fā)明專(zhuān)利]基于生成對(duì)抗網(wǎng)絡(luò)的滑動(dòng)定向數(shù)據(jù)小樣本擴(kuò)增方法在審
| 申請(qǐng)?zhí)枺?/td> | 202010802807.2 | 申請(qǐng)日: | 2020-08-11 |
| 公開(kāi)(公告)號(hào): | CN112001480A | 公開(kāi)(公告)日: | 2020-11-27 |
| 發(fā)明(設(shè)計(jì))人: | 劉偉;白璟;譚東;張德軍;陳東;連太煒;汪洋;張宇;李中權(quán);馮思恒;張?chǎng)?/a>;孫銘椿;王鈺豪 | 申請(qǐng)(專(zhuān)利權(quán))人: | 中國(guó)石油天然氣集團(tuán)有限公司;中國(guó)石油集團(tuán)川慶鉆探工程有限公司 |
| 主分類(lèi)號(hào): | G06N3/04 | 分類(lèi)號(hào): | G06N3/04;G06N3/08 |
| 代理公司: | 成都天嘉專(zhuān)利事務(wù)所(普通合伙) 51211 | 代理人: | 毛光軍 |
| 地址: | 100007 *** | 國(guó)省代碼: | 北京;11 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 基于 生成 對(duì)抗 網(wǎng)絡(luò) 滑動(dòng) 定向 數(shù)據(jù) 樣本 擴(kuò)增 方法 | ||
本發(fā)明公開(kāi)了一種基于生成對(duì)抗網(wǎng)絡(luò)的滑動(dòng)定向數(shù)據(jù)小樣本擴(kuò)增方法,包括如下步驟:(1)數(shù)據(jù)剪裁;(2)多數(shù)據(jù)塊疊合;(3)提取類(lèi)別標(biāo)簽;(4)訓(xùn)練生成對(duì)抗網(wǎng)絡(luò);(5)獲得多類(lèi)別的生成數(shù)據(jù);(6)獲得有效擴(kuò)增數(shù)據(jù)。本發(fā)明實(shí)現(xiàn)了多系統(tǒng)數(shù)據(jù)直接比較分析,即通過(guò)現(xiàn)有小樣本庫(kù)數(shù)據(jù)進(jìn)行訓(xùn)練,通過(guò)生成器和判別器的不斷“博弈”使生成器生成足夠以假亂真的序列數(shù)據(jù),以達(dá)到擴(kuò)充鉆探參數(shù)樣本庫(kù)的目的。
技術(shù)領(lǐng)域
本發(fā)明涉及一種基于生成對(duì)抗網(wǎng)絡(luò)的滑動(dòng)定向數(shù)據(jù)小樣本擴(kuò)增方法,屬于油氣鉆井(鉆探)工程技術(shù)領(lǐng)域
背景技術(shù)
對(duì)于滑動(dòng)定向數(shù)據(jù),由于錄井、MWD、扭擺三個(gè)系統(tǒng)相互獨(dú)立,采集頻率各異,數(shù)據(jù)的完整性、準(zhǔn)確性、及時(shí)性等方面存在較大差距,各系統(tǒng)產(chǎn)生的大量數(shù)據(jù)無(wú)法提煉升華為有效數(shù)據(jù),不能直接比較分析。同時(shí)由于采集軟件重啟、通信故障等因素易造成丟失亂碼等問(wèn)題,給數(shù)據(jù)的準(zhǔn)確定和可靠性造成了很大的影響。直接導(dǎo)致經(jīng)數(shù)據(jù)清洗整合后的有效數(shù)據(jù)集數(shù)據(jù)含量過(guò)低,如果直接應(yīng)用于神經(jīng)網(wǎng)絡(luò)模型訓(xùn)練,容易導(dǎo)致模型的過(guò)擬合,使模型泛化程度大大降低,無(wú)法滿(mǎn)足神經(jīng)網(wǎng)絡(luò)模型的需求。
滑動(dòng)定向數(shù)據(jù)集屬于典型的小樣本學(xué)習(xí)問(wèn)題,為了有效解決此類(lèi)學(xué)習(xí)問(wèn)題,第一種常見(jiàn)思路是通過(guò)改進(jìn)算法來(lái)使其更適應(yīng)于滑動(dòng)定向數(shù)據(jù)的小樣本環(huán)境。有研究者提出了一種融合專(zhuān)業(yè)知識(shí)和機(jī)器學(xué)習(xí)算法的引導(dǎo)學(xué)習(xí)方法,利用可表示的專(zhuān)業(yè)知識(shí)和經(jīng)驗(yàn),指導(dǎo)學(xué)習(xí)器對(duì)樣本數(shù)據(jù)進(jìn)行訓(xùn)練,優(yōu)化學(xué)習(xí)模型參數(shù),從而減少對(duì)海量樣本數(shù)據(jù)的依賴(lài)。但是該方法在先驗(yàn)知識(shí)與機(jī)器學(xué)習(xí)算法融合的機(jī)理研究以及具體的經(jīng)驗(yàn)知識(shí)提取和封裝等方面還需要進(jìn)行進(jìn)一步深入研究。第二種常見(jiàn)方法是將深度學(xué)習(xí)技術(shù)與遷移學(xué)習(xí)相結(jié)合再應(yīng)用于滑動(dòng)定向數(shù)據(jù)集,先在相關(guān)領(lǐng)域的大數(shù)據(jù)集中對(duì)卷積神經(jīng)網(wǎng)絡(luò)模型進(jìn)行預(yù)訓(xùn)練,提取出預(yù)訓(xùn)練模型的權(quán)重和樣本特征,用于目標(biāo)小數(shù)據(jù)集中對(duì)模型進(jìn)行初始化,以幫助模型對(duì)目標(biāo)小數(shù)據(jù)集展開(kāi)訓(xùn)練。該方法需要目標(biāo)小數(shù)據(jù)集在相關(guān)領(lǐng)域中有可以輔助的大規(guī)模數(shù)據(jù)集,而在石油鉆探行業(yè)中缺少可輔助的大數(shù)據(jù)集,因此該方法無(wú)法很好地在石油進(jìn)行應(yīng)用。第三種常用方法是通過(guò)對(duì)已有滑動(dòng)定向數(shù)據(jù)樣本進(jìn)行一定的處理來(lái)增加樣本的數(shù)量。有研究者利用支持向量機(jī)結(jié)合網(wǎng)格搜索法對(duì)原始小樣本數(shù)據(jù)進(jìn)行預(yù)測(cè)擴(kuò)充。但是支持向量機(jī)對(duì)缺失數(shù)據(jù)、參數(shù)和核函數(shù)的選擇比較敏感,目前還沒(méi)有好的方法來(lái)解決核函數(shù)的選取問(wèn)題。
發(fā)明內(nèi)容
本發(fā)明的目的在于克服現(xiàn)有技術(shù)存在的上述問(wèn)題,提供一種基于生成對(duì)抗網(wǎng)絡(luò)的滑動(dòng)定向數(shù)據(jù)小樣本擴(kuò)增方法。本發(fā)明實(shí)現(xiàn)了多系統(tǒng)數(shù)據(jù)直接比較分析,即通過(guò)現(xiàn)有小樣本庫(kù)數(shù)據(jù)進(jìn)行訓(xùn)練,通過(guò)生成器和判別器的不斷“博弈”使生成器生成足夠以假亂真的序列數(shù)據(jù),以達(dá)到擴(kuò)充鉆探參數(shù)樣本庫(kù)的目的。
為實(shí)現(xiàn)上述目的,本發(fā)明采用的技術(shù)方案如下:
一種基于生成對(duì)抗網(wǎng)絡(luò)的滑動(dòng)定向數(shù)據(jù)小樣本擴(kuò)增方法,其特征在于,包括如下步驟:
(1)數(shù)據(jù)剪裁:在不影響滑動(dòng)定向數(shù)據(jù)特征表示的前提下,對(duì)訓(xùn)練數(shù)據(jù)集中的數(shù)據(jù)進(jìn)行剪裁;
(2)多數(shù)據(jù)塊疊合:在輸入的通道維度上對(duì)數(shù)據(jù)塊按順序進(jìn)行疊合,使其適應(yīng)生成對(duì)抗網(wǎng)絡(luò)的多維輸入;
(3)提取類(lèi)別標(biāo)簽:分別對(duì)步驟(2)中的數(shù)據(jù)塊按對(duì)應(yīng)的類(lèi)別標(biāo)簽序列進(jìn)行編碼;
(4)訓(xùn)練生成對(duì)抗網(wǎng)絡(luò):用劃分好的數(shù)據(jù)塊、標(biāo)簽序列和隨機(jī)高維噪聲訓(xùn)練生成對(duì)抗網(wǎng)絡(luò);
(5)獲得多類(lèi)別的生成數(shù)據(jù);輸入目標(biāo)類(lèi)別的隨機(jī)噪聲,獲得該類(lèi)別的生成數(shù)據(jù),調(diào)整標(biāo)簽信息,獲得不同參數(shù)類(lèi)別的生成數(shù)據(jù);
(6)獲得有效擴(kuò)增數(shù)據(jù):將步驟(5)中的生成數(shù)據(jù)重新剪裁為相應(yīng)的數(shù)據(jù)塊,并按數(shù)據(jù)表尺寸進(jìn)行拼接擴(kuò)增,成為與原數(shù)據(jù)集同規(guī)格的數(shù)據(jù)。
步驟(1)中,根據(jù)其數(shù)據(jù)結(jié)構(gòu),可將其劃分為多個(gè)n m維的“數(shù)據(jù)塊”,其中m代表預(yù)輸入數(shù)據(jù)的維度,n代表每批次輸入的行數(shù)。
步驟(1)中,采取設(shè)置數(shù)據(jù)塊最大及最小尺寸的方式對(duì)數(shù)據(jù)裁剪行為進(jìn)行規(guī)范和限定。
該專(zhuān)利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專(zhuān)利權(quán)人授權(quán)。該專(zhuān)利全部權(quán)利屬于中國(guó)石油天然氣集團(tuán)有限公司;中國(guó)石油集團(tuán)川慶鉆探工程有限公司,未經(jīng)中國(guó)石油天然氣集團(tuán)有限公司;中國(guó)石油集團(tuán)川慶鉆探工程有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買(mǎi)此專(zhuān)利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010802807.2/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專(zhuān)利網(wǎng)。
- 同類(lèi)專(zhuān)利
- 專(zhuān)利分類(lèi)
- 農(nóng)業(yè)信息對(duì)抗資源目標(biāo)規(guī)劃最優(yōu)分配方法
- 農(nóng)業(yè)信息對(duì)抗資源模糊規(guī)劃最優(yōu)分配方法
- 農(nóng)業(yè)信息對(duì)抗資源線(xiàn)性規(guī)劃最優(yōu)分配方法
- 基于聚類(lèi)數(shù)據(jù)挖掘的對(duì)抗行為搜索算法
- 面向多種對(duì)抗圖片攻擊的協(xié)同免疫防御方法
- 一種自適應(yīng)對(duì)抗強(qiáng)度的對(duì)抗訓(xùn)練方法
- 對(duì)抗攻擊模型的訓(xùn)練方法及裝置
- 對(duì)抗樣本的生成方法和裝置
- 多樣本對(duì)抗擾動(dòng)生成方法、裝置、存儲(chǔ)介質(zhì)和計(jì)算設(shè)備
- 一種無(wú)人集群協(xié)同博弈對(duì)抗的控制方法及系統(tǒng)
- 網(wǎng)絡(luò)和網(wǎng)絡(luò)終端
- 網(wǎng)絡(luò)DNA
- 網(wǎng)絡(luò)地址自適應(yīng)系統(tǒng)和方法及應(yīng)用系統(tǒng)和方法
- 網(wǎng)絡(luò)系統(tǒng)及網(wǎng)絡(luò)至網(wǎng)絡(luò)橋接器
- 一種電力線(xiàn)網(wǎng)絡(luò)中根節(jié)點(diǎn)網(wǎng)絡(luò)協(xié)調(diào)方法和系統(tǒng)
- 一種多網(wǎng)絡(luò)定位方法、存儲(chǔ)介質(zhì)及移動(dòng)終端
- 網(wǎng)絡(luò)裝置、網(wǎng)絡(luò)系統(tǒng)、網(wǎng)絡(luò)方法以及網(wǎng)絡(luò)程序
- 從重復(fù)網(wǎng)絡(luò)地址自動(dòng)恢復(fù)的方法、網(wǎng)絡(luò)設(shè)備及其存儲(chǔ)介質(zhì)
- 神經(jīng)網(wǎng)絡(luò)的訓(xùn)練方法、裝置及存儲(chǔ)介質(zhì)
- 網(wǎng)絡(luò)管理方法和裝置





