[發明專利]一種基于圖像的疫木檢測與定位方法及系統在審
| 申請號: | 202110821397.0 | 申請日: | 2021-07-20 |
| 公開(公告)號: | CN113379738A | 公開(公告)日: | 2021-09-10 |
| 發明(設計)人: | 侯俊嶺;李偉紅;楊利平;張超;王欣然 | 申請(專利權)人: | 重慶大學 |
| 主分類號: | G06T7/00 | 分類號: | G06T7/00;G06T7/70;G06N3/04;G06N3/08 |
| 代理公司: | 重慶華科專利事務所 50123 | 代理人: | 康海燕 |
| 地址: | 400030 *** | 國省代碼: | 重慶;50 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 圖像 檢測 定位 方法 系統 | ||
1.一種基于圖像的疫木檢測與定位方法,其特征在于,包括以下步驟:
步驟1:視頻預處理:將云臺觀測塔拍攝的視頻抽取出單幀圖像,進行圖像預處理和標注,制作成數據集供網絡模型訓練、驗證和測試;
步驟2:構建多尺度候選區域融合網絡,在步驟1獲得的數據集上訓練該模型;
步驟3:將待測試圖像輸入到訓練好的多尺度候選區域融合檢測網絡,得到輸出結果,根據疫木三維定位幾何模型,計算出疫木具體的地理三維坐標。
2.根據權利要求1所述基于圖像的疫木檢測與定位方法,其特征在于:所述步驟2具體步驟為:
步驟2-1:對多尺度候選區域融合網絡的輸入圖像進行預處理,然后將圖像縮放固定到224*224像素,最后將224*224像素的圖像和放大一倍圖像、縮小一倍圖像分別作為多尺度候選區域融合網絡的輸入;
步驟2-2:分別將224*224像素的圖像輸入到卷積神經網絡(ResNet32)中,將224*224像素放大一倍的圖像輸入到卷積神經網絡(ResNet18)中,將224*224像素縮小一倍的圖像輸入到卷積神經網絡(ResNet50)中,得到相對應的特征圖;
步驟2-3:從特征圖得到不同的候選區域。以ResNet18的特征圖檢測小目標的候選區域生成網絡RPN,為S-RPN;以ResNet32的特征圖檢測中型目標的RPN,為M-RPN;以ResNet50的特征圖檢測大型目標的RPN,為L-RPN;采用非最大抑制NMS減少冗余的候選區域;
步驟2-4:通過步驟1獲得的數據集在深度學習機上訓練該多尺度候選區域融合網絡,反復調節參數直至網絡收斂,保存訓練好的網絡參數。
3.根據權利要求2所述基于圖像的疫木檢測與定位方法,其特征在于:所述步驟2-1對多尺度候選區域融合網絡的輸入圖像進行預處理,包括圖像翻轉、旋轉、色彩變換、加入高斯噪聲等數據增強處理。
4.根據權利要求2所述基于圖像的疫木檢測與定位方法,其特征在于:所述步驟2-3的采用非最大抑制NMS減少冗余的候選區域,具體如下:
對于每個RPN模型,首先,為每個錨框分配一個正標簽或負標簽。正標簽的遵循兩個原則:(1)與真值區域具有最高IoU(交并比)的Anchor;或者(2)與真值區域的IoU值高于0.7的Anchor。負標簽則是與真值區域的IoU值低于0.3的Anchor。而IoU分數在0.3-0.7范圍內的Anchor則既不屬于正標簽也不屬于負標簽,在RPN模型訓練中無作用;
然后,采用多任務損失函數作為模型訓練的損失函數,其具體定義如下:
其中,i是一個批量的索引,pi表示第i個錨生成的候選區域是目標區域的預測概率,表示該區域的真值標簽,其中0表示負,1表示正。上述公式中對分類損失函數和回歸損失函數分別采用Ncls、Nreg以平衡權重λ進行歸一化。對于分類損失函數采用log損失函數,對于回歸損失函數采用smoothL1損失函數。在邊界框回歸中,分別對預測框的中心點坐標以及預測框的寬高進行回歸,預測框ti和真值框分別如下定義。
其中,x、y分別表示預測框中心坐標,w、h分別表示預測框的寬和高;xa、ya分別表示錨的中心坐標,wa、ha分別表示錨的寬和高;x*、y*分別表示真值框的中心坐標,w*、h*分別表示真值框的寬和高。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于重慶大學,未經重慶大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110821397.0/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種治療溫熱病的熏蒸藥劑
- 下一篇:一種市政搶修用便攜式消防水炮
- 彩色圖像和單色圖像的圖像處理
- 圖像編碼/圖像解碼方法以及圖像編碼/圖像解碼裝置
- 圖像處理裝置、圖像形成裝置、圖像讀取裝置、圖像處理方法
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序以及圖像解碼程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序、以及圖像解碼程序
- 圖像形成設備、圖像形成系統和圖像形成方法
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序





