[發(fā)明專利]一種地質(zhì)方向人工神經(jīng)網(wǎng)絡訓練數(shù)據(jù)的擴展方法有效
| 申請?zhí)枺?/td> | 202011353345.7 | 申請日: | 2020-11-27 |
| 公開(公告)號: | CN112465023B | 公開(公告)日: | 2021-06-18 |
| 發(fā)明(設計)人: | 杜星;趙曉龍 | 申請(專利權)人: | 自然資源部第一海洋研究所 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62;G06N3/04;G06N3/08;G06Q50/02 |
| 代理公司: | 廣州市合本知識產(chǎn)權代理事務所(普通合伙) 44421 | 代理人: | 劉潔 |
| 地址: | 266000 山*** | 國省代碼: | 山東;37 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 地質(zhì) 方向 人工 神經(jīng)網(wǎng)絡 訓練 數(shù)據(jù) 擴展 方法 | ||
1.一種地質(zhì)方向人工神經(jīng)網(wǎng)絡訓練數(shù)據(jù)的擴展方法,其特征在于:包括以下步驟:
步驟A、地質(zhì)數(shù)據(jù)的獲?。?/p>
獲取研究海洋地質(zhì)問題或區(qū)域的相關參數(shù),用以保證數(shù)據(jù)的準確性,所有參數(shù)對應的數(shù)據(jù)為原始數(shù)據(jù)t;
步驟B、數(shù)據(jù)分析篩選:
分析哪些參數(shù)進行數(shù)據(jù)擴展后對結果沒有影響,篩選出適宜進行擴展處理的參數(shù),作為可擴展參數(shù);
將原始數(shù)據(jù)t按比例分成a%和(1-a%)兩部分,其中a%的數(shù)據(jù)作為訓練數(shù)據(jù)X進行擴展處理使用,所述訓練數(shù)據(jù)X的總量為t×a%,剩余(1-a%)的數(shù)據(jù)作為二次檢驗數(shù)據(jù)Y使用,所述二次檢驗數(shù)據(jù)Y的總量為t×(1-a%);
步驟C、數(shù)據(jù)擴展與前處理:
C1、數(shù)據(jù)擴展處理:
將篩選出的可擴展參數(shù)所對應的訓練數(shù)據(jù)X,使用數(shù)值臨近法進行擴展,同一個參數(shù)擴展的數(shù)量和不同參數(shù)之間的組合方式根據(jù)實際情況進行校驗后確定,具體為:
每一行作為一組數(shù)據(jù),當對x行y列的參數(shù)進行擴展時,可擴展參數(shù)的數(shù)量為m,m≤y;假設指定某一參數(shù)a3進行擴展時,擴展的總量為s、擴展次數(shù)為n,則每次擴展的步長為:
所述訓練數(shù)據(jù)X擴展后的總量變?yōu)榱薠(n+1);
若對m個參數(shù)均進行擴展,考慮到不同參數(shù)之間的排列組合,擴展后訓練數(shù)據(jù)的最大參數(shù)總量為Z:
則擴展后訓練數(shù)據(jù)的總量Z比原有訓練數(shù)據(jù)X的總量多了組參數(shù);
C2、數(shù)據(jù)前處理:
將步驟C1的擴展后訓練數(shù)據(jù)總量Z進行歸一化處理,原始數(shù)據(jù)線性化的方法轉(zhuǎn)換到[0,1]的范圍,歸一化公式為:
其中,amax為樣本數(shù)據(jù)的最大值,amin為樣本數(shù)據(jù)的最小值,歸一化后再次將數(shù)據(jù)分成b%和1-b%兩部分,其中b%的數(shù)據(jù)作為最終訓練數(shù)據(jù)用于模型訓練使用,所述最終訓練數(shù)據(jù)的總量為Z×b%;剩余(1-b%)的數(shù)據(jù)作為初次檢驗數(shù)據(jù)用于模型初次檢驗使用,所述初次檢驗數(shù)據(jù)的總量為Z×(1-b%);
步驟D、模型訓練:
使用人工神經(jīng)網(wǎng)絡模型,對步驟C2的最終訓練數(shù)據(jù)進行模型訓練,當滿足精度需求后,停止訓練得到所需模型;
步驟E、準確性驗證:
準確性檢驗共分為兩個步驟,分別為初次檢驗和二次檢驗;其中,初次檢驗步驟中使用的數(shù)據(jù)為初次檢驗數(shù)據(jù),若模型計算后準確性達標則通過檢驗,若不達標則需要重新訓練;
達標后再進行二次檢驗,二次檢驗步驟中使用的數(shù)據(jù)為二次檢驗數(shù)據(jù)Y進行訓練,該部分不受數(shù)據(jù)擴展的影響,因此可以防止“過擬合”現(xiàn)象的出現(xiàn);
所述準確性檢驗,若初次檢驗、二次檢驗的準確率均較低,則應重新進行數(shù)據(jù)擴展和訓練;若初次檢驗準確率很高,二次檢驗準確率低,則說明出現(xiàn)“過擬合”現(xiàn)象,應減小訓練數(shù)據(jù)的量,重新訓練;若初次檢驗和二次檢驗的準確率均較高,則表示模型較為可靠。
2.根據(jù)權利要求1所述的一種地質(zhì)方向人工神經(jīng)網(wǎng)絡訓練數(shù)據(jù)的擴展方法,其特征在于:步驟A中,所述參數(shù)包括內(nèi)動力地質(zhì)作用參數(shù)、外動力地質(zhì)作用參數(shù)和研究對象自身地質(zhì)參數(shù)。
3.根據(jù)權利要求1所述的一種地質(zhì)方向人工神經(jīng)網(wǎng)絡訓練數(shù)據(jù)的擴展方法,其特征在于:步驟B中,a%設置為60%~85%。
4.根據(jù)權利要求1所述的一種地質(zhì)方向人工神經(jīng)網(wǎng)絡訓練數(shù)據(jù)的擴展方法,其特征在于:步驟C2中,b%設置為60%~85%。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于自然資源部第一海洋研究所,未經(jīng)自然資源部第一海洋研究所許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011353345.7/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 硬件神經(jīng)網(wǎng)絡轉(zhuǎn)換方法、計算裝置、軟硬件協(xié)作系統(tǒng)
- 生成較大神經(jīng)網(wǎng)絡
- 神經(jīng)網(wǎng)絡的生成方法、生成裝置和電子設備
- 一種舌診方法、裝置、計算設備及計算機存儲介質(zhì)
- 學習神經(jīng)網(wǎng)絡結構
- 脈沖神經(jīng)網(wǎng)絡轉(zhuǎn)換方法及相關轉(zhuǎn)換芯片
- 圖像處理方法、裝置、可讀存儲介質(zhì)和計算機設備
- 一種適應目標數(shù)據(jù)集的網(wǎng)絡模型微調(diào)方法、系統(tǒng)、終端和存儲介質(zhì)
- 用于重構人工神經(jīng)網(wǎng)絡的處理器及其操作方法、電氣設備
- 一種圖像神經(jīng)網(wǎng)絡結構的優(yōu)化方法及裝置





