[發明專利]一種共享型測井數據挖掘方法在審
| 申請號: | 201911086499.1 | 申請日: | 2019-11-08 |
| 公開(公告)號: | CN111090680A | 公開(公告)日: | 2020-05-01 |
| 發明(設計)人: | 鄧志勇;丁磊;胡向陽;張恒榮;劉土亮 | 申請(專利權)人: | 中國海洋石油集團有限公司;中海石油(中國)有限公司湛江分公司 |
| 主分類號: | G06F16/2458 | 分類號: | G06F16/2458 |
| 代理公司: | 廣州市南鋒專利事務所有限公司 44228 | 代理人: | 李慧 |
| 地址: | 100010 北*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 共享 測井 數據 挖掘 方法 | ||
本發明公開了一種共享型測井數據挖掘方法,包括以下步驟:輸入與目標學習任務相關的所有測井曲線以及目標曲線組成的學習樣本,將學習樣本的數據轉變為二維矩陣,并對二維矩陣進行歸一標準化操作,利用曲線智能選擇來獲取有價值的學習樣本,利用算法智能選擇來獲取數據挖掘方法,利用參數智能選擇來優化數據挖掘模型,學習知識保存到巖石物理數據挖掘知識庫及共享調用。本發明的有益效果:本發明能夠快速和智能地選擇曲線、算法、參數,并且支持模型共享,將完成目標學習任務需要使用的測井曲線組合、數據挖掘方法以及方法參數的組合快速準確的求取出來,有利于測井曲線重構、巖石物理相分類等測井數據挖掘任務的精確實施。
技術領域
本發明涉及物理測井數據挖掘技術領域,具體涉及一種共享型測井數據挖掘方法。
背景技術
在地球物理測井數據挖掘過程中,學習樣本的構建、學習方法的選擇以及方法參數的設置是影響數據挖掘效果的關鍵所在。目前業界在這三方面仍是采用純人工設置的方式,尤其是學習方法的選擇以及方法參數的設置,都是根據前一次學習結果的好壞,結合解釋人員自身的理解,嘗試性的調整方法和參數,這種方式效率差且難以得到最優的方法選擇和參數組合。
發明內容
本發明的目的在于提供一種共享型測井數據挖掘方法,能夠快速和智能地選擇曲線、算法、參數,并且支持模型共享,能夠將完成目標學習任務需要使用的測井曲線組合、數據挖掘方法以及方法參數的組合快速準確的求取出來。
為了實現上述目的,本發明采用如下技術方案:
一種共享型測井數據挖掘方法,包括以下步驟:
步驟一:輸入與目標學習任務相關的所有測井曲線以及目標曲線組成的學習樣本,然后將學習樣本缺失值填充為均值,將測井曲線值重復的深度刪除,再將定性的文本數據轉變為二維矩陣,最后對二維矩陣進行歸一標準化操作;
步驟二:曲線智能選擇,取學習樣本中每個曲線,計算曲線的發散性和相關性,曲線的發散性計算公式為:
曲線的相關性計算公式為:
根據上述公式綜合得到每個曲線的價值評分,選擇價值評分最高的若干條曲線作為有價值的學習曲線,并且組成新的學習樣本;
步驟三:算法智能選擇,在巖石物理數據挖掘知識庫中,調用各種方法的經驗參數,然后將學習樣本按比例分割,使用m次交叉驗證綜合得到各種數據挖掘方法的準確度,尋找前n個準確度最高的方法作為數據挖掘的方法;
步驟四:參數智能選擇,按照數據挖掘方法的數量,劃分s個線程來進行每個方法的參數智能選擇,使用超參數自動尋優,選定所有參數的變化范圍,采用迭代的方法,取第i個參數組合,計算出方法的準確度,若是第i個參數組合的準確度大于前面i-1個參數組合的最大準確度,則第i個參數組合更新為最佳參數組合,否則不更新,然后進行下一次迭代,直至遍歷完所有參數可能的組合,最終確定各方法的最佳參數組合,獲取的最佳參數組合會用于最終的數據挖掘,并得到數據挖掘模型;
步驟五:學習知識保存及共享調用,將數據挖掘相關學習知識保存到巖石物理數據挖掘知識庫中,當需要使用數據挖掘相關學習知識時,從巖石物理數據挖掘知識庫中調用數據挖掘相關學習知識,根據曲線重定向確定預測樣本輸入曲線,再運用數據挖掘模型來獲得預測曲線。
優選地,在所述的步驟一中,測井曲線包括但不限于自然伽馬曲線、自然電位曲線、中子密度曲線、電阻率曲線,目標曲線為需要預測的曲線,包括但不限于孔隙度曲線、滲透率曲線。
優選地,在所述的步驟三中,從巖石物理數據巖石物理數據挖掘知識庫中調用的方法包括但不限于支持向量機、貝葉斯和梯度提升樹。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國海洋石油集團有限公司;中海石油(中國)有限公司湛江分公司,未經中國海洋石油集團有限公司;中海石油(中國)有限公司湛江分公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201911086499.1/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種提高固態硬盤陣列性能的方法與服務器
- 下一篇:一種可拆合的帶式輸送設備
- 數據顯示系統、數據中繼設備、數據中繼方法、數據系統、接收設備和數據讀取方法
- 數據記錄方法、數據記錄裝置、數據記錄媒體、數據重播方法和數據重播裝置
- 數據發送方法、數據發送系統、數據發送裝置以及數據結構
- 數據顯示系統、數據中繼設備、數據中繼方法及數據系統
- 數據嵌入裝置、數據嵌入方法、數據提取裝置及數據提取方法
- 數據管理裝置、數據編輯裝置、數據閱覽裝置、數據管理方法、數據編輯方法以及數據閱覽方法
- 數據發送和數據接收設備、數據發送和數據接收方法
- 數據發送裝置、數據接收裝置、數據收發系統、數據發送方法、數據接收方法和數據收發方法
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置





