[發明專利]基于生成對抗網絡的滑動定向數據小樣本擴增方法在審
| 申請號: | 202010802807.2 | 申請日: | 2020-08-11 |
| 公開(公告)號: | CN112001480A | 公開(公告)日: | 2020-11-27 |
| 發明(設計)人: | 劉偉;白璟;譚東;張德軍;陳東;連太煒;汪洋;張宇;李中權;馮思恒;張鑫;孫銘椿;王鈺豪 | 申請(專利權)人: | 中國石油天然氣集團有限公司;中國石油集團川慶鉆探工程有限公司 |
| 主分類號: | G06N3/04 | 分類號: | G06N3/04;G06N3/08 |
| 代理公司: | 成都天嘉專利事務所(普通合伙) 51211 | 代理人: | 毛光軍 |
| 地址: | 100007 *** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 生成 對抗 網絡 滑動 定向 數據 樣本 擴增 方法 | ||
本發明公開了一種基于生成對抗網絡的滑動定向數據小樣本擴增方法,包括如下步驟:(1)數據剪裁;(2)多數據塊疊合;(3)提取類別標簽;(4)訓練生成對抗網絡;(5)獲得多類別的生成數據;(6)獲得有效擴增數據。本發明實現了多系統數據直接比較分析,即通過現有小樣本庫數據進行訓練,通過生成器和判別器的不斷“博弈”使生成器生成足夠以假亂真的序列數據,以達到擴充鉆探參數樣本庫的目的。
技術領域
本發明涉及一種基于生成對抗網絡的滑動定向數據小樣本擴增方法,屬于油氣鉆井(鉆探)工程技術領域
背景技術
對于滑動定向數據,由于錄井、MWD、扭擺三個系統相互獨立,采集頻率各異,數據的完整性、準確性、及時性等方面存在較大差距,各系統產生的大量數據無法提煉升華為有效數據,不能直接比較分析。同時由于采集軟件重啟、通信故障等因素易造成丟失亂碼等問題,給數據的準確定和可靠性造成了很大的影響。直接導致經數據清洗整合后的有效數據集數據含量過低,如果直接應用于神經網絡模型訓練,容易導致模型的過擬合,使模型泛化程度大大降低,無法滿足神經網絡模型的需求。
滑動定向數據集屬于典型的小樣本學習問題,為了有效解決此類學習問題,第一種常見思路是通過改進算法來使其更適應于滑動定向數據的小樣本環境。有研究者提出了一種融合專業知識和機器學習算法的引導學習方法,利用可表示的專業知識和經驗,指導學習器對樣本數據進行訓練,優化學習模型參數,從而減少對海量樣本數據的依賴。但是該方法在先驗知識與機器學習算法融合的機理研究以及具體的經驗知識提取和封裝等方面還需要進行進一步深入研究。第二種常見方法是將深度學習技術與遷移學習相結合再應用于滑動定向數據集,先在相關領域的大數據集中對卷積神經網絡模型進行預訓練,提取出預訓練模型的權重和樣本特征,用于目標小數據集中對模型進行初始化,以幫助模型對目標小數據集展開訓練。該方法需要目標小數據集在相關領域中有可以輔助的大規模數據集,而在石油鉆探行業中缺少可輔助的大數據集,因此該方法無法很好地在石油進行應用。第三種常用方法是通過對已有滑動定向數據樣本進行一定的處理來增加樣本的數量。有研究者利用支持向量機結合網格搜索法對原始小樣本數據進行預測擴充。但是支持向量機對缺失數據、參數和核函數的選擇比較敏感,目前還沒有好的方法來解決核函數的選取問題。
發明內容
本發明的目的在于克服現有技術存在的上述問題,提供一種基于生成對抗網絡的滑動定向數據小樣本擴增方法。本發明實現了多系統數據直接比較分析,即通過現有小樣本庫數據進行訓練,通過生成器和判別器的不斷“博弈”使生成器生成足夠以假亂真的序列數據,以達到擴充鉆探參數樣本庫的目的。
為實現上述目的,本發明采用的技術方案如下:
一種基于生成對抗網絡的滑動定向數據小樣本擴增方法,其特征在于,包括如下步驟:
(1)數據剪裁:在不影響滑動定向數據特征表示的前提下,對訓練數據集中的數據進行剪裁;
(2)多數據塊疊合:在輸入的通道維度上對數據塊按順序進行疊合,使其適應生成對抗網絡的多維輸入;
(3)提取類別標簽:分別對步驟(2)中的數據塊按對應的類別標簽序列進行編碼;
(4)訓練生成對抗網絡:用劃分好的數據塊、標簽序列和隨機高維噪聲訓練生成對抗網絡;
(5)獲得多類別的生成數據;輸入目標類別的隨機噪聲,獲得該類別的生成數據,調整標簽信息,獲得不同參數類別的生成數據;
(6)獲得有效擴增數據:將步驟(5)中的生成數據重新剪裁為相應的數據塊,并按數據表尺寸進行拼接擴增,成為與原數據集同規格的數據。
步驟(1)中,根據其數據結構,可將其劃分為多個n m維的“數據塊”,其中m代表預輸入數據的維度,n代表每批次輸入的行數。
步驟(1)中,采取設置數據塊最大及最小尺寸的方式對數據裁剪行為進行規范和限定。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國石油天然氣集團有限公司;中國石油集團川慶鉆探工程有限公司,未經中國石油天然氣集團有限公司;中國石油集團川慶鉆探工程有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010802807.2/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種軟土增強固化方法
- 下一篇:一種穩固式農業機械固定臺





