[發明專利]基于正則化的信息分析方法在審
| 申請號: | 201711294493.4 | 申請日: | 2017-12-08 |
| 公開(公告)號: | CN107992450A | 公開(公告)日: | 2018-05-04 |
| 發明(設計)人: | 徐嬌 | 申請(專利權)人: | 成都谷問信息技術有限公司 |
| 主分類號: | G06F17/15 | 分類號: | G06F17/15 |
| 代理公司: | 成都路航知識產權代理有限公司51256 | 代理人: | 李凌 |
| 地址: | 610000 四川省成都市高*** | 國省代碼: | 四川;51 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 正則 信息 分析 方法 | ||
技術領域
本發明涉及計算機技術領域,具體涉及基于正則化的信息分析方法。
背景技術
數據分析是指用適當的統計分析方法對收集來的大量數據進行分析,提取有用信息和形成結論而對數據加以詳細研究和概括總結的過程。這一過程也是質量管理體系的支持過程。在實用中,數據分析可幫助人們作出判斷,以便采取適當行動。數據分析的數學基礎在20世紀早期就已確立,但直到計算機的出現才使得實際操作成為可能,并使得數據分析得以推廣。數據分析是數學與計算機科學相結合的產物。
然而現有的數據信息分析方法中,由于無法對數據中所有的項目進行準確確認,所以得出的分析結果中,非常容易出現過擬合,即將不同類的相似項歸為一類,影響數據分析結果。
發明內容
本發明所要解決的技術問題是現有的數據信息分析方法中,由于無法對數據中所有的項目進行準確確認,所以得出的分析結果中,非常容易出現過擬合,即將不同類的相似項歸為一類,影響數據分析結果,目的在于提供基于正則化的信息分析方法,解決上述問題。
本發明通過下述技術方案實現:
基于正則化的信息分析方法,包括以下步驟:S1:對數據進行線性回歸擬合產生擬合函數;S2:根據擬合函數和數據得出經驗風險;S3:設置正則化項;S4:將正則化項和經驗風險求和得到結構風險;S5:根據結構風險對擬合函數進行修正。
現有技術中,由于無法對數據中所有的項目進行準確確認,所以得出的分析結果中,非常容易出現過擬合,即將不同類的相似項歸為一類,影響數據分析結果。本發明應用時,先對數據進行線性回歸擬合產生擬合函數;再根據擬合函數和數據得出經驗風險;然后設置正則化項;再然后將正則化項和經驗風險求和得到結構風險;再然后根據結構風險對擬合函數進行修正。本發明通過引入正則項,規避影響因子比較小的項目,從而使得不同類的相似項不會被歸為一類,提高了分析結果的精度。
進一步的,所述正則化項采用多維函數。
進一步的,所述擬合函數采用高階多項式。
進一步的,所述高階多項式的項數為五個及以上。
進一步的,步驟S5還包括以下子步驟:得出結構風險的L1范數,并根據L1范數對擬合函數進行修正。
本發明與現有技術相比,具有如下的優點和有益效果:
本發明基于正則化的信息分析方法,通過引入正則項,規避影響因子比較小的項目,從而使得不同類的相似項不會被歸為一類,提高了分析結果的精度。
具體實施方式
為使本發明的目的、技術方案和優點更加清楚明白,下面結合實施例,對本發明作進一步的詳細說明,本發明的示意性實施方式及其說明僅用于解釋本發明,并不作為對本發明的限定。
實施例
本發明基于正則化的信息分析方法,包括以下步驟:S1:對數據進行線性回歸擬合產生擬合函數;S2:根據擬合函數和數據得出經驗風險;S3:設置正則化項;S4:將正則化項和經驗風險求和得到結構風險;S5:根據結構風險對擬合函數進行修正。所述正則化項采用多維函數。所述擬合函數采用高階多項式。所述高階多項式的項數為五個及以上。步驟S5還包括以下子步驟:得出結構風險的L1范數,并根據L1范數對擬合函數進行修正。
本實施例實施時,先對數據進行線性回歸擬合產生擬合函數;再根據擬合函數和數據得出經驗風險;然后設置正則化項;再然后將正則化項和經驗風險求和得到結構風險;再然后根據結構風險對擬合函數進行修正。本發明通過引入正則項,規避影響因子比較小的項目,從而使得不同類的相似項不會被歸為一類,提高了分析結果的精度。
以上所述的具體實施方式,對本發明的目的、技術方案和有益效果進行了進一步詳細說明,所應理解的是,以上所述僅為本發明的具體實施方式而已,并不用于限定本發明的保護范圍,凡在本發明的精神和原則之內,所做的任何修改、等同替換、改進等,均應包含在本發明的保護范圍之內。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于成都谷問信息技術有限公司,未經成都谷問信息技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201711294493.4/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種基于低秩表示的地鐵異常流量檢測方法
- 下一篇:雙芯皮線分支器
- 信息記錄介質、信息記錄方法、信息記錄設備、信息再現方法和信息再現設備
- 信息記錄裝置、信息記錄方法、信息記錄介質、信息復制裝置和信息復制方法
- 信息記錄裝置、信息再現裝置、信息記錄方法、信息再現方法、信息記錄程序、信息再現程序、以及信息記錄介質
- 信息記錄裝置、信息再現裝置、信息記錄方法、信息再現方法、信息記錄程序、信息再現程序、以及信息記錄介質
- 信息記錄設備、信息重放設備、信息記錄方法、信息重放方法、以及信息記錄介質
- 信息存儲介質、信息記錄方法、信息重放方法、信息記錄設備、以及信息重放設備
- 信息存儲介質、信息記錄方法、信息回放方法、信息記錄設備和信息回放設備
- 信息記錄介質、信息記錄方法、信息記錄裝置、信息再現方法和信息再現裝置
- 信息終端,信息終端的信息呈現方法和信息呈現程序
- 信息創建、信息發送方法及信息創建、信息發送裝置





