[發明專利]一種基于深度學習的機器學習識別方法在審
| 申請號: | 202010224110.1 | 申請日: | 2020-03-26 |
| 公開(公告)號: | CN111382191A | 公開(公告)日: | 2020-07-07 |
| 發明(設計)人: | 張彩琴 | 申請(專利權)人: | 呂梁學院 |
| 主分類號: | G06F16/2458 | 分類號: | G06F16/2458;G06N3/04;G06N3/08;G06N20/00 |
| 代理公司: | 西安合創非凡知識產權代理事務所(普通合伙) 61248 | 代理人: | 高志永 |
| 地址: | 033001 *** | 國省代碼: | 山西;14 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 深度 學習 機器 識別 方法 | ||
本發明公開了一種基于深度學習的機器學習識別方法,包括如下步驟:S1、根據識別目標參數基于BP神經網絡模型實現訓練參數集相關指標數據的獲取;S2、根據獲取到的相關指標數據調用對應的數據挖掘模塊和/或Faster R?CNN模型實現訓練參數集的自動檢測采集;S3、根據識別目標參數以及獲取到的相關指標參數調用對應的數據預處理模型實現訓練參數集的預處理,獲取訓練集數據和測試集數據;S4、將訓練集數據輸入對應的機器學習模型進行學習訓練,然后根據正向傳播和反向傳播對神經網絡的參數進行更新,直到模型收斂,保存訓練好的模型。本發明整個過程依賴不同的神經網絡模型自動完成,可以大大提高機器學習的效率。
技術領域
本發明涉及機器學習領域,具體涉及一種基于深度學習的機器學習識別方法。
背景技術
隨著大數據時代的到來,海量數據的分類和挖掘技術顯得尤為重要。在海 量數據挖掘中,如何利用從已有數據中分類和挖掘出來的信息來指導新數據的分類和挖掘已成為一個新的研究熱點。特別是當某些任務的樣本數量較少時,利用多任務學習能夠有效的減少海量數據分類和挖掘的時間成本并提高信息獲取準確度。
基于深度學習方法在實踐中被證明是一種有效、魯棒的信息分類方法。深度神經網路(例如深度卷積神經網絡)是最具代表性的機器學習方法。深度學習模型通常有數十層可學習的數據處理層,有數十萬、甚至數百萬的可以學習參數。由于大量參數構成極其巨大的學習空間,為了得到最優的模型參數,通常需要大量的訓練數據。但是,為了訓練深度學習模型,必須構建擁有大量樣本的訓練數據集,通常訓練樣本數量在數萬以上。然而,構建這樣的訓練集,在實際應用中是非常困難的。
在深度學習方法用于分類任務時,傳統的深度學習方法要求分類模型對比樣本的類必須與生產樣本的類相同,即模型只能分類已學習的類,如果有新的類的樣本需要分類,必須重新訓練機器學習模型,或者對機器學習模型做一些適應性的訓練學習。這也導致了基于深度學習方法的機器學習模 型的訓練,需要消耗大量的訓練計算資源和較長的訓練學習時間,限制了其在實際應用場合中的使用便利性和通用性。
發明內容
為解決上述問題,本發明提供了一種基于深度學習的機器學習識別方法。
為實現上述目的,本發明采取的技術方案為:
一種基于深度學習的機器學習識別方法,包括如下步驟:
S1、根據識別目標參數基于BP神經網絡模型實現訓練參數集相關指標數據的獲取;
S2、根據獲取到的相關指標數據調用對應的數據挖掘模塊和/或Faster R-CNN模型實現訓練參數集的自動檢測采集;
S3、根據識別目標參數以及獲取到的相關指標參數調用對應的數據預處理模型實現訓練參數集的預處理,獲取訓練集數據和測試集數據;
S4、將訓練集數據輸入對應的機器學習模型進行學習訓練,然后根據正向傳播和反向傳播對神經網絡的參數進行更新,直到模型收斂,保存訓練好的模型;
S5、應用訓練好的模型和測試集數據對模型進行預測,根據模型的訓練日志和預測日志對模型進行分析,繪制訓練和測試Accracy及loss曲線,判斷該模型是否可以有效地進行目標參數識別。
進一步地,在發現新的訓練數據時,首先構建新的訓練數據與相關指標參數的關聯關系,然后將新的訓練數據轉換成采用相關指標參數表達的參數,即可輸入對應的訓練好的模型進行訓練。
進一步地,所述步驟S3中的數據預處理模型采用Inception_V3神經網絡模型。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于呂梁學院,未經呂梁學院許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010224110.1/2.html,轉載請聲明來源鉆瓜專利網。





