[發(fā)明專利]一種曲線擬合的檢驗方法在審
| 申請?zhí)枺?/td> | 201710429498.7 | 申請日: | 2017-06-08 |
| 公開(公告)號: | CN108228534A | 公開(公告)日: | 2018-06-29 |
| 發(fā)明(設(shè)計)人: | 韓超;季統(tǒng)凱 | 申請(專利權(quán))人: | 國云科技股份有限公司 |
| 主分類號: | G06F17/15 | 分類號: | G06F17/15 |
| 代理公司: | 廣東莞信律師事務(wù)所 44332 | 代理人: | 余倫 |
| 地址: | 523808 廣東省東*** | 國省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 模型函數(shù) 平方和 曲線擬合 數(shù)據(jù)集 對數(shù)函數(shù) 使用數(shù)據(jù) 數(shù)據(jù)分析 線性模型 最優(yōu)模型 關(guān)聯(lián)性 冪函數(shù) 求解 檢驗 挖掘 分析 | ||
本發(fā)明涉及數(shù)據(jù)分析挖掘技術(shù)領(lǐng)域,具體涉及一種數(shù)據(jù)集的曲線擬合的檢驗方法。本發(fā)明方法是先設(shè)定相關(guān)性判斷值;然后,對數(shù)據(jù)集進行相關(guān)性分析,如果相關(guān)性r大于判斷值,表示關(guān)聯(lián)性極強,則使用線性模型函數(shù);否則,使用數(shù)據(jù)集對多項式二次、多項式三次、多項式五次、冪函數(shù)和對數(shù)函數(shù)這五種模型函數(shù)分別進行計算,求解各模型函數(shù)的系數(shù),得到具體的模型函數(shù);然后比較各個點到模型函數(shù)距離的平方和的大小,選擇平方和值小的模型函數(shù)。本發(fā)明提供了一種選擇最優(yōu)模型函數(shù)的方法。
技術(shù)領(lǐng)域
本發(fā)明涉及數(shù)據(jù)分析挖掘技術(shù)領(lǐng)域,具體涉及一種數(shù)據(jù)集的曲線擬合的檢驗方法。
背景技術(shù)
隨著云計算和大數(shù)據(jù)技術(shù)的不斷發(fā)展,數(shù)據(jù)的分析和挖掘這一環(huán)節(jié)顯得尤為重要。數(shù)據(jù)的價值需要通過挖掘和分析才能充分地體現(xiàn)出來;而曲線擬合作為比較常用的方法,對數(shù)據(jù)的分析有著重要的作用。
發(fā)明內(nèi)容
本發(fā)明解決的技術(shù)問題在于提供一種曲線擬合的檢驗方法,使得計算更加準(zhǔn)確,可提供更優(yōu)的模型函數(shù)的選擇。
本發(fā)明解決上述技術(shù)問題的技術(shù)方案是:
所述的方法是先設(shè)定相關(guān)性判斷值;然后,對數(shù)據(jù)集進行相關(guān)性分析,如果相關(guān)性r大于判斷值,表示關(guān)聯(lián)性極強,則使用線性模型函數(shù);否則,使用數(shù)據(jù)集對多項式二次、多項式三次、多項式五次、冪函數(shù)和對數(shù)函數(shù)這五種模型函數(shù)分別進行計算,求解各模型函數(shù)的系數(shù),得到具體的模型函數(shù);然后比較各個點到模型函數(shù)距離的平方和的大小,和越小表示擬合的效果越佳,可選擇平方和值小的模型函數(shù)。
所述的模型函數(shù)的數(shù)學(xué)表達式分別如下:
(1)y=ax+b,線性函數(shù);
(2)y=ax2+bx+c,多項式二次函數(shù);
(3)y=ax3+bx2+c,多項式三次函數(shù);
(4)y=ax5+bx4+cx3+dx2+ex+c,多項式五次函數(shù);
(5)y=axb,冪函數(shù);
(6)y=alogx+b,對數(shù)函數(shù)。
所述的相關(guān)性r的判斷值設(shè)定為0.8。
使用點到直線的距離的平方和作為衡量的標(biāo)準(zhǔn),即在曲線上存在某點,使得這點的切線與數(shù)據(jù)集的某點的連線與切線垂直,并得到其距離。
所述的方法詳細(xì)流程如下:
(1)、讀取外部數(shù)據(jù)進入緩存;
(2)、分析數(shù)據(jù)集的相關(guān)系數(shù):當(dāng)ρ>0.8時,直接選擇線性擬合,結(jié)束本流程;當(dāng)ρ<0.2時,執(zhí)行下一步;
(3)、按順序選擇五種模型函數(shù)之中的一種計算集合點到曲線的距離的平方和;設(shè)曲線為f(x,y)=0,O點為曲線上的切點,則切向量則通過計算以上兩方程即可得到切點位置;
(4)、計算距離的平方和。
(5)、存儲上一步的距離計算結(jié)果d,重復(fù)第三步計算,直到所有模型函數(shù)的被計算完畢,得到五個距離平方和結(jié)果;
(6)、通過對比計算結(jié)果,找到最小的距離結(jié)果對應(yīng)的模型函數(shù)即為最優(yōu)的模型函數(shù)。
本發(fā)明的方法從一系列的檢驗流程和方法中得出最優(yōu)的模型函數(shù),為數(shù)據(jù)的分析提供較為準(zhǔn)確的判斷。在計算距離時,同時考慮了X、Y的影響,距離計算更為精確。
附圖說明
下面結(jié)合附圖對本發(fā)明進一步說明:
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于國云科技股份有限公司,未經(jīng)國云科技股份有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710429498.7/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 數(shù)據(jù)集及數(shù)據(jù)集“異或”的DMA傳送
- 數(shù)據(jù)處理的方法和系統(tǒng)
- 鏈接數(shù)據(jù)集
- 數(shù)據(jù)處理方法及其設(shè)備
- VR視頻轉(zhuǎn)碼方法及裝置
- 數(shù)據(jù)匹配方法以及裝置
- 一種非平衡數(shù)據(jù)集的分類方法
- 處理數(shù)據(jù)的方法、裝置、電子設(shè)備及可讀存儲介質(zhì)
- 基于數(shù)據(jù)傾斜的關(guān)聯(lián)查詢方法、裝置、設(shè)備及存儲介質(zhì)
- 一種實體識別模型的建立方法、系統(tǒng)、電子設(shè)備及介質(zhì)





