[發明專利]基于改進SSD神經網絡的統計樹木數量的方法及系統在審
| 申請號: | 202010635369.5 | 申請日: | 2020-07-03 |
| 公開(公告)號: | CN111860623A | 公開(公告)日: | 2020-10-30 |
| 發明(設計)人: | 韓巧玲;劉雷;趙燕東;趙玥;席本野;宋美慧;李晨曦 | 申請(專利權)人: | 北京林業大學 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62;G06T7/00;G06N3/04;G06N3/08 |
| 代理公司: | 北京路浩知識產權代理有限公司 11002 | 代理人: | 楊云云 |
| 地址: | 100083 北京市*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 改進 ssd 神經網絡 統計 樹木 數量 方法 系統 | ||
本發明實施例公開了一種基于改進SSD神經網絡的統計樹木數量的方法及系統,方法包括:采集圖像,其中,圖像為航拍的環境圖像;將圖像輸入預先訓練好的用于識別樹木的神經網絡模型中,以通過神經網絡模型識別圖像中的樹木,其中,神經網絡模型包括一一對應地提取多個尺度的特征圖像的多個卷積層、以及一一對應地對多個尺度的特征圖進行特征融合的多個反卷積層,以由多個反卷積層獲取到融合后的新特征圖。本發明的基于改進SSD神經網絡的統計樹木數量的方法,通過對圖像分析之前,對神經網絡模型進行訓練,從而,能夠對復雜環境下的圖像均具有普適性,并且可以精確的識別到樹木的數量,進而,提高對林業資源統計的精確度。
技術領域
本發明涉及圖像處理技術領域,具體涉及一種基于改進SSD神經網絡的統計樹木數量的方法及系統。
背景技術
卷積神經網絡在圖像分類、行人檢測以及標志識別方面得到廣泛應用。例如:使用卷積神經網絡對無人機航拍的圖像中建筑類、林地、水體等進行分類識別。然而,利用無人機獲取的林木圖像中環境信息復雜,通過目前的神經網絡識別過程中,精度較差,即:識別樹木不夠準確。
發明內容
基于現有技術中存在的問題,本發明實施例提出了一種基于改進SSD神經網絡的統計樹木數量的方法及系統。
第一方面,本發明實施例提供了一種基于改進SSD神經網絡的統計樹木數量的方法,包括:
采集圖像,其中,所述圖像為航拍的環境圖像;
將所述圖像輸入預先訓練好的用于識別樹木的神經網絡模型中,以通過所述神經網絡模型識別所述圖像中的樹木,
其中,所述神經網絡模型包括一一對應地提取多個尺度的特征圖像的多個卷積層、以及一一對應地對多個尺度的特征圖進行特征融合的多個反卷積層,以由所述多個反卷積層獲取到融合后的新特征圖。
在一些示例中,還包括對所述神經網絡模型進行訓練的步驟,具體為:
獲取多個圖像訓練樣本;
對多個圖像訓練樣本進行多尺度的特征圖映射;
對多尺度的特征圖進行先驗框匹配和數據增強訓練,得到訓練完成的用于識別樹木的所述神經網絡模型。
在一些示例中,所述對多個圖像訓練樣本進行多尺度的特征圖映射,包括:
使用可提取多個尺度的特征圖的多個卷積層提取所述多個尺度的特征圖,并通過與對應的反卷積層的前后端融合,得到融合后的新特征圖。
在一些示例中,所述對多尺度的特征圖進行先驗框匹配和數據增強訓練,得到訓練完成的用于識別樹木的所述神經網絡模型,包括:
基于多個尺度的特征圖,設置尺度或者長寬比不同的先驗框;
通過水平翻轉、裁剪、放大和縮小中的一個或多個方式對多尺度的特征圖進行數據增強。
在一些示例中,所述對所述神經網絡模型進行訓練,包括:
對于多個圖像訓練樣本中每個真實目標,找到與其交并比IOU最大的先驗框;
通過所述先驗框與對應的真實目標進行匹配;
對剩余的未匹配的先驗框,如果真實目標的交并比IOU大于預設值,則通過所述先驗框與對應的真實目標進行匹配;
對負樣本進行抽樣,抽樣時按照置信度誤差進行降序排列,并選取誤差的較大的top-k作為訓練的負樣本。
在一些示例中,所述通過所述神經網絡模型識別所述圖像中的樹木時,所述多尺度的特征圖的尺度越大,用于檢測的目標越小。
在一些示例中,在所述神經網絡模型中,通過設置的損失函數進行多個圖像訓練樣本的分類。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京林業大學,未經北京林業大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010635369.5/2.html,轉載請聲明來源鉆瓜專利網。





