[發明專利]一種用于評估統計值變異性的方法有效
| 申請號: | 201811231417.3 | 申請日: | 2018-10-22 |
| 公開(公告)號: | CN109241147B | 公開(公告)日: | 2022-07-01 |
| 發明(設計)人: | 劉新田;王海杰;吳愨 | 申請(專利權)人: | 上海工程技術大學 |
| 主分類號: | G06F16/2458 | 分類號: | G06F16/2458 |
| 代理公司: | 上海唯智贏專利代理事務所(普通合伙) 31293 | 代理人: | 姜曉艷 |
| 地址: | 201620 *** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 用于 評估 統計 變異性 方法 | ||
本發明屬于數據處理的技術領域,公開了一種用于評估統計值變異性的方法,包括以下步驟:步驟一、以樣本數據X={x1,x2,…,xn}對應的概率密度曲線為基礎,建立n個誤差圓,其中,n表示樣本數據的總個數;步驟二、從每個所述誤差圓內均隨機抽取w個擴充數據,建立包含n個擴充數據的自助樣本;步驟三、利用Bootstrap自助法對所述自助樣本進行樣本數據的變異性評估。本發明從誤差圓中隨機抽取的自助樣本的數據具有普遍性,并且避免集中誤差圓內某一區域的抽取,減小了對再抽樣分布不均的影響,使得到的擴充樣本更加合理,且精確可信,進而促使通過Bootstrap方法計算得到的結果更加精確,更加逼近實際狀況。
技術領域
本發明屬于數據處理的技術領域,具體涉及一種用于評估統計值變異性的方法以及一種用于Bootstrap自助法的自助樣本的獲取方法。
背景技術
在工程應用和科學研究中,通常采用一定的儀器、工具、傳感器或其他手段對各種類型的物理量進行觀測,從而獲得大量的觀測數據。由于外界條件、測量儀器和和觀測人員等因素的影響,觀測數據與真實值存在一定的誤差,考慮各種誤差帶來的影響,得到更加精確合理的結果對工程應用和科學研究有著重大的意義。
Bootstrap方法,又稱自助法是美國Stanford大學統計系教授Efron提出的一種新的統計推斷方法,是一種只依賴于給定的觀測信息,而不需要其它假設和增加新的觀測的統計推斷方法。在科學研究中,它可以大大增強常用的估計、推斷等方法的效能,在工程實踐中,它也成為克服數據有限性等困難的一種有效手段,如在導彈的命中圓域的概率估計、圖像處理以及其他許多應用領域都取得了成功。但是Bootstrap方法也有不足之處,如由于自助樣本只能由原樣本生成,自助樣本極有可能非常相似于原樣本,尤其當樣本容量較小時更為明顯,容易導致計算結果極大偏離真實分布,因此,有必要對現有Bootstrap方法進行改進和優化,以提高其準確度。
發明內容
本發明提供了一種用于Bootstrap自助法的自助樣本的獲取方法以及用于評估統計值變異性的方法,解決了現在現有Bootstrap方法的自助樣本只能由原樣本生成,容易導致計算結果極大偏離真實分布等問題。
本發明可通過以下技術方案實現:
一種用于評估統計值變異性的方法,包括以下步驟:
步驟一、以樣本數據X={x1,x2,…,xn}對應的概率密度曲線為基礎,建立n個誤差圓,其中,n表示樣本數據的總個數;
步驟二、從每個所述誤差圓內均隨機抽取w個擴充數據,建立包含n個擴充數據的自助樣本;
步驟三、利用Bootstrap自助法對所述自助樣本進行樣本數據的變異性評估。
進一步,所述誤差圓以樣本數據X={x1,x2,…,xn}對應其概率密度曲線上的點為圓心,以所述樣本數據的抽樣極限誤差為最大半徑。
進一步,所述n個擴充數據來自全部或者部分的誤差圓。
進一步,將所述誤差圓的水平直徑等分成多份,對應地所述誤差圓分成多個部分,從每個所述部分按照各自的預定概率隨機抽取多個擴充數據,共同組成w個擴充數據。
進一步,每個所述部分對應的預定概率通過所述部分的面積與整個誤差圓的面積的比值計算得到。
進一步,將所述誤差圓的水平直徑等分成五份,對應地所述誤差圓分成五個部分,每個所述部分對應的預定概率分別為0.142、0.232、0.252、0.232、0.142。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于上海工程技術大學,未經上海工程技術大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811231417.3/2.html,轉載請聲明來源鉆瓜專利網。





