[發明專利]一種基于機器學習的回歸分析模型選擇方法在審
| 申請號: | 202110417540.X | 申請日: | 2021-04-19 |
| 公開(公告)號: | CN113127806A | 公開(公告)日: | 2021-07-16 |
| 發明(設計)人: | 汪麗莉;劉燁;李偉豪;郭博研;吳炎欣;楊涵文 | 申請(專利權)人: | 上海工程技術大學 |
| 主分類號: | G06F17/18 | 分類號: | G06F17/18;G06K9/62;G06N3/04;G06N3/08;G06N20/00 |
| 代理公司: | 上海伯瑞杰知識產權代理有限公司 31227 | 代理人: | 孟旭彤 |
| 地址: | 201620 *** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 機器 學習 回歸 分析 模型 選擇 方法 | ||
本發明公開了一種基于機器學習的回歸分析模型選擇方法,解決了傳統回歸分析模型選擇過程復雜、現有機器學習進行數據回歸分析的適用范圍受限的問題,其技術方案要點是首先選擇可被使用于回歸的備選連續函數模型集合,再根據選定的連續函數模型集合,使用數據增強策略生成機器訓練數據圖像,其次建立一個卷積神經網絡,將訓練數據圖像輸入并進行訓練,最后使用訓練后的卷積神經網絡對待分析數據進行分析,給出最佳回歸模型,本發明的一種基于機器學習的回歸分析模型選擇方法,能高準確率的提供邏輯清晰的回歸模型,以低成本實現神經網絡對真實數據的回歸模型的判定能力。
技術領域
本發明涉及回歸分析技術,特別涉及一種基于機器學習的回歸分析模型選擇方法。
背景技術
作為重要的數據分析手段,回歸分析在監控經濟活動、建筑工程、醫學及工業制造等領域都有廣泛的應用。其目的是使用數據擬合方法尋求多種變量之間的函數關系。然而,在數據擬合過程中,始終存在分析模型的選擇問題。在傳統的回歸分析執行中,分析模型的選擇過程較為復雜。
近年來,隨著先進計算技術的飛快發展,基于機器學習的回歸分析方法獲得了廣泛的關注。基于BP(Back—Propagation)神經網絡的數據回歸方法,能夠以極高準確率解釋并預言數據。雖然不需要選擇回歸模型,但是機器學習中的復雜的網絡結構以及繁多的網絡參數,隱藏了數據間的邏輯關系。導致其分析結果不能被人直接理解。此外,構建分析結果準確的神經網絡還需要預先存儲大量的訓練數據,因此也限制了使用機器學習神經網絡進行數據回歸分析的適用范圍。
發明內容
本發明的目的是提供一種基于機器學習的回歸分析模型選擇方法,能高準確率的提供邏輯清晰的回歸模型,以低成本實現神經網絡對真實數據的回歸模型的判定能力。
本發明的上述技術目的是通過以下技術方案得以實現的:
一種基于機器學習的回歸分析模型選擇方法,包括有以下步驟:
S1、選擇可被使用于回歸的備選連續函數模型集合;
S2、根據選定的連續函數模型集合,使用數據增強策略生成機器訓練數據圖像;
S3、建立一個卷積神經網絡,將訓練數據圖像輸入并進行訓練;
S4、使用訓練后的卷積神經網絡對待分析數據進行分析,給出最佳回歸模型。
作為優選,所述連續函數模型集合包括有線性函數、二次函數、高階多項式函數、指數函數、反比例函數。
作為優選,根據數據增強策略生成訓練數據圖像具體為:
S21、假設待分析數據組為{X:x1,x2,…,xn}和{Y:y1,y2,…,yn},根據待分析數據的區間[x1,xn],由備選連續函數模型的函數關系計算區間上準確函數值集合;
S22、在準確值基礎上,加入噪聲,產生噪聲數據{Y′:y′1,y′2,…,y′n};
S23、計算噪聲數據的中心差分值,將中心差分值圖像化,建立訓練和驗證數據圖像集。
作為優選,數據增強策略對各備選函數數據的中心差分值圖像化具體為:將線性函數表達為水平直線圖像形式,將二次函數表達為傾斜直線圖像形式,將三次函數表達為曲線圖像形式。
作為優選,建立的所述卷積神經網絡依次包括有第一個卷積層、第一個池化層、第二個卷積層、第二個池化層,以及三個全連接層;第三個全連接層根據輸入圖像數據的模型數量N設定為N種分類輸出。
綜上所述,本發明具有以下有益效果:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于上海工程技術大學,未經上海工程技術大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110417540.X/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種稀土材料自動稱量系統
- 下一篇:顯示裝置





