[發明專利]一種基于錄井大數據的卡鉆事故檢測預警方法在審
| 申請號: | 201811425245.3 | 申請日: | 2018-11-27 |
| 公開(公告)號: | CN109594967A | 公開(公告)日: | 2019-04-09 |
| 發明(設計)人: | 薛質;涂曦予;沈建濤;蔡雪梅 | 申請(專利權)人: | 南通世盾信息技術有限公司 |
| 主分類號: | E21B44/00 | 分類號: | E21B44/00;E21B47/00 |
| 代理公司: | 南京鐘山專利代理有限公司 32252 | 代理人: | 戴朝榮 |
| 地址: | 226000 江蘇省南通市*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 大數據 卡鉆 錄井 檢測 預警 預處理 數據預處理 檢測數據 交叉驗證 錄井裝置 模型處理 判別模型 判斷數據 人員記錄 日志數據 事故檢測 數據特征 隨機森林 業務參數 業務數據 有效信息 原始數據 自動標注 鉆井工程 鉆井事故 重采樣 準確率 選型 字段 采集 學習 管理 | ||
1.一種基于錄井大數據的卡鉆檢測預警方法,其特征在于包含以下步驟:
步驟一:數據預處理,將自動錄井裝置采集的業務參數和管理人員記錄的日志數據進行預處理,實現鉆井事故自動標注;
步驟二:數據特征重組,對原始數據進行重采樣和平滑處理,判斷數據字段的重要性;
步驟三:學習模型選型,采用隨機森林模型處理卡鉆檢測數據;
步驟四:判別模型調優,采用交叉驗證方法對學習模型進行調參,并將最終生成的模型用于檢測鉆井工程異常。
2.按照權利要求1所述的一種基于錄井大數據的卡鉆檢測預警方法,其特征在于:所述步驟一具體為
現有錄井數據包括自動錄井裝置采集的業務參數以及管理人員記錄的日志數據,前者屬于結構化數據,而后者則屬于非結構化數據;
對于結構化數據,每口井擁有相當多的字段,其中包括大量缺失或者無效數據,認為恒定字段以及缺失值占比超過80%的字段為無效數據并予以刪除,對于其余缺失值采用插值的方法進行補充;
對于非結構化數據,采用語料匹配的方法對日志信息進行提取,生成形式為“井號,時間,事故類型”的結構化數據,達到鉆井事故自動標注的目的。
3.按照權利要求2所述的一種基于錄井大數據的卡鉆檢測預警方法,其特征在于:所述自動錄井裝置采集的業務參數包含出入口流量、立管壓力。
4.按照權利要求2所述的一種基于錄井大數據的卡鉆檢測預警方法,其特征在于:所述管理人員記錄的日志數據包含事故類型、事故時間。
5.按照權利要求1所述的一種基于錄井大數據的卡鉆檢測預警方法,其特征在于:所述步驟二具體為
首先,原始生產數據的更新周期通常很短,產生了大量的冗余數據,需要進行重采樣;
然后,設備采集的數據中存在噪音成分,設定滑動窗口對數據進行移動平均處理,使得數據的變化更為平滑穩定;
最后,采用主成分分析方法判斷數據字段的重要性,從而幫助管理人員更好地利用參數判斷工程異常。
6.按照權利要求5所述的一種基于錄井大數據的卡鉆檢測預警方法,其特征在于:所述主成分分析方法是通過計算數據矩陣的協方差矩陣,并得到協方差矩陣的特征值與特征向量,特征值越大表明該特征越重要。
7.按照權利要求6所述的一種基于錄井大數據的卡鉆檢測預警方法,其特征在于:假定錄井設備采集了N組數據,即{X(1),X(2),…,X(i),…,X(N)},其中X(i)∈Rm,為X(i)的第j個生產參數,則主成分分析的具體步驟如下:
(1)將特征數據進行標準化:
其中為第j個參數的樣本均值;
(2)計算協方差矩陣:
C=DX(DX)T/N,
其中為標準化后的數據矩陣;
(3)將協方差矩陣進行特征分解:
C=UΛUT,
其中為特征值矩陣,且λ1,λ2,…,λd為非遞減序列,U=[u1,u2,…,um]為對應的特征向量矩陣;
(4)特征值的排序決定了數據字段的重要程度,即前l個重要的字段為u1,u2,…,ul,l≤m。
8.按照權利要求1所述的一種基于錄井大數據的卡鉆檢測預警方法,其特征在于:所述步驟三具體為
卡鉆檢測在本質上屬于多分類問題,即根據工程參數判斷此時的工況是否存在異常,并且屬于哪類異常,因此采用的學習模型為隨機森林,通過建立多個模型組合來解決該多分類問題,基于多個弱分類器的結果進行投票選擇,最終生成一個強分類器。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于南通世盾信息技術有限公司,未經南通世盾信息技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811425245.3/1.html,轉載請聲明來源鉆瓜專利網。





