[發明專利]一種基于線性插值偏差的推進劑制備數據缺失值填補方法有效
| 申請號: | 202110669240.0 | 申請日: | 2021-06-17 | 
| 公開(公告)號: | CN113313194B | 公開(公告)日: | 2023-04-07 | 
| 發明(設計)人: | 張維;張浩晨 | 申請(專利權)人: | 西北工業大學 | 
| 主分類號: | G06F18/214 | 分類號: | G06F18/214;G06F18/241;G06N3/0464;G06N3/08 | 
| 代理公司: | 西安凱多思知識產權代理事務所(普通合伙) 61290 | 代理人: | 劉新瓊 | 
| 地址: | 710072 *** | 國省代碼: | 陜西;61 | 
| 權利要求書: | 查看更多 | 說明書: | 查看更多 | 
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 線性插值 偏差 推進 制備 數據 缺失 填補 方法 | ||
本發明公開了一種基于線性插值偏差的推進劑制備數據缺失值填補方法,首先對連續缺失值進行線性插值填補,然后對缺失值以及缺失值前后一個真實值進行線性插值和線性回歸進行擬填補,再根據擬填補所得的兩種結果計算偏差值Δ1,最后通過偏差擬合得到第一次線性插值所存在的偏差Δ2,最終通過彌補偏差得到最終的缺失值填補值,對后續的產品質量分類以及質量預測和控制提供完整有效的數據基礎。本發明降低了測試樣本的填補值和真實值的平均誤差。
技術領域
本發明屬于改性雙基推進劑制備技術領域,具體涉及一種數據短時缺失值填補方法。
背景技術
目前,針對于缺失值的處理最為廣泛的常用的方法包括忽略含缺失項的記錄、將缺失值視為特殊值或者插補缺失值。采用刪除含缺失項記錄的方法能夠最大程度保證數據的真實性和有效性,但是當數據樣本量小時,刪除含缺失項記錄會大大影響數據的分布以及變化趨勢,而采用填充的方法比簡單刪除記錄更有利于后續數據的利用。從數據分析的角度看,缺失值的這種未知性掩蓋了數據分布,干擾了屬性相關性的發現,這使得統計分析結果大打折扣,影響最終決策。
在對缺失值進行填補處理時,目前所采用的例如線性插值和線性回歸方法,對工業生產數據進行填補時都會導致填補的數據缺少工業數據分布所有的耦合性和時序性,尤其當工業生產數據樣本量少且波動性不大時,每一項數據對整體的波動性都有極大的影響,且工業生產數大多具有耦合性,每一項工藝特征都與其他工藝特征具有線性或非線性的關心,同一項工藝中所有的不同特征參數也具有強相關性。因此,在對工業數據進行缺失項填補時,必須同時考慮到數據自身所具有的波動性特征,以及缺失數據所在特征與其他工藝特征所產生的相關性。
發明內容
為了克服現有技術的不足,本發明提供了一種基于線性插值偏差的推進劑制備數據缺失值填補方法,首先對連續缺失值進行線性插值填補,然后對缺失值以及缺失值前后一個真實值進行線性插值和線性回歸進行擬填補,再根據擬填補所得的兩種結果計算偏差值Δ1,最后通過偏差擬合得到第一次線性插值所存在的偏差Δ2,最終通過彌補偏差得到最終的缺失值填補值,對后續的產品質量分類以及質量預測和控制提供完整有效的數據基礎。本發明降低了測試樣本的填補值和真實值的平均誤差。
本發明解決其技術問題所采用的技術方案包括如下步驟:
步驟1:對改性雙基推進劑制備質量數據中所有的2到4個連續缺失值進行線性插值;
步驟1-1:確定改性雙基推進劑制備質量數據中連續缺失值的數據所在的特征列X;
步驟1-2:確定改性雙基推進劑制備質量數據中連續缺失項的數據所在特征列X的位置Xp-Xp+n,1<n<5;
步驟1-3:按照公式(1)對改性雙基推進劑制備質量數據中含有連續缺失值的特征列X直接進行第一次線性插值得到連續缺失項Xp-Xp+n的值,分別為Xp,1-Xp+n,1,公式(1)如下:
其中,ta與ya是待求數據點對應的時刻與估計值,te與ye是數據缺失時間段后首個有效記錄點對應的時刻與實際值,ts與ys是數據缺失時間段前最近有效記錄點對應的時刻與實際值;
步驟1-4:將步驟1-3中改性雙基推進劑制備質量數據中連續缺失項的填補值Xp,1-Xp+n,1中的中間填補值Xp+1,1-Xp+n-1,1作為第一次直接線性插值后的待去除真實偏差的值YAp+1-YAp+n-1;
步驟2:對改性雙基推進劑制備質量數據中連續缺失項進行線性回歸計算;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于西北工業大學,未經西北工業大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110669240.0/2.html,轉載請聲明來源鉆瓜專利網。





