[發明專利]模型生成的方法、裝置、計算機設備和存儲介質在審
| 申請號: | 202010196133.6 | 申請日: | 2020-03-19 |
| 公開(公告)號: | CN111428869A | 公開(公告)日: | 2020-07-17 |
| 發明(設計)人: | 王鵬軍;黃智科 | 申請(專利權)人: | 北京源清慧虹信息科技有限公司 |
| 主分類號: | G06N3/06 | 分類號: | G06N3/06;G06N3/08 |
| 代理公司: | 北京華進京聯知識產權代理有限公司 11606 | 代理人: | 孫巖 |
| 地址: | 100192 北京市*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 模型 生成 方法 裝置 計算機 設備 存儲 介質 | ||
本申請涉及一種模型生成的方法、裝置、計算機設備和存儲介質。該方法包括:計算機設備獲取待創建的神經網絡模型的樣本參數;根據樣本參數,獲取神經網絡模型的訓練數據樣本;計算機設備接收用戶輸入的神經網絡創建指令,創建神經網絡模型,該神經網絡創建指令中包括神經網絡模型包含的各網絡層的類型、每個網絡層的激活狀態及包含的神經元的數目和輸入數據維度;計算機設備根據訓練數據樣本、訓練方法和用戶輸入的訓練樣本策略,對神經網絡模型進行訓練,得到目標神經網絡模型。采用本方法可以通過人機交互的方式,實現神經網絡模型的生成。
技術領域
本申請涉及計算機技術領域,特別是涉及一種模型生成的方法、裝置、計算機設備和存儲介質。
背景技術
隨著大數據時代的到來,出現了越來越多數據處理的方法和模型,其中,利用神經網絡模型進行數據處理,可以廣泛的應用于神經科學、人工智能、信息處理等多個領域。
然而,神經網絡模型的生成,需要使用者具備專業的編程能力且具有專業的編程設備,因此,亟需一種通過簡單設置,就可以實現模型生成的方法。
發明內容
基于此,有必要針對上述技術問題,提供一種模型生成的方法、裝置、計算機設備和存儲介質。
第一方面,提供了一種模型生成的方法,所述方法包括:
獲取待創建的神經網絡模型的樣本參數;
根據所述樣本參數,獲取所述神經網絡模型的訓練數據樣本;
接收用戶輸入的神經網絡創建指令,創建所述神經網絡模型,所述神經網絡創建指令中包括所述神經網絡模型包含的各網絡層的類型、每個網絡層的激活狀態及包含的神經元的數目和輸入數據維度;
根據所述訓練數據樣本、訓練方法和用戶輸入的訓練樣本策略,對所述神經網絡模型進行訓練,得到目標神經網絡模型。
作為一種可選的實施方式,所述方法還包括:
獲取所述目標神經網絡模型的模型收斂曲線,并根據所述模型收斂曲線中的損失值和度量值,對所述目標神經網絡模型的收斂性進行判斷;
如果所述損失值小于所述預設損失閾值且所述度量值小于所述預設度量閾值,則判定所述目標神經網絡模型收斂;
如果所述損失值大于或等于所述預設損失閾值或所述度量值大于或等于所述預設度量閾值,則判定所述目標神經網絡模型不收斂,并提示用戶重新修改所述訓練樣本策略和所述訓練方法中的編譯參數。
作為一種可選的實施方式,所述方法還包括:
根據所述訓練樣本策略中的驗證拆分參數,獲得驗證數據集,并根據所述驗證數據集對所述目標神經網絡模型進行驗證評分處理,得到驗證評分;
如果所述驗證評分低于預設的分數閾值,則重新執行所述根據所述訓練數據樣本、訓練方法和用戶輸入的訓練樣本策略,對所述神經網絡模型進行訓練,得到目標神經網絡模型的步驟;
如果所述驗證評分等于或高于所述預設的分數閾值,則導出所述目標神經網絡模型。
作為一種可選的實施方式,所述根據所述樣本參數,獲取所述神經網絡模型的訓練數據樣本,包括:
根據所述樣本參數,獲取導入數據樣本;
根據預設的數據處理方法,對所述導入數據樣本進行抽取-轉換-加載處理,得到所述訓練數據樣本。
第二方面,提供了一種模型的生成裝置,所述裝置包括:
第一獲取模塊,用于獲取待創建的神經網絡模型的樣本參數;
第二獲取模塊,用于根據所述樣本參數,獲取所述神經網絡模型的訓練數據樣本;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京源清慧虹信息科技有限公司,未經北京源清慧虹信息科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010196133.6/2.html,轉載請聲明來源鉆瓜專利網。





