[發(fā)明專利]基于主動學習的聲吶圖像目標識別方法有效
| 申請?zhí)枺?/td> | 201911099760.1 | 申請日: | 2019-11-12 |
| 公開(公告)號: | CN110837870B | 公開(公告)日: | 2023-05-12 |
| 發(fā)明(設計)人: | 鄧雨田;姜龍玉 | 申請(專利權)人: | 東南大學 |
| 主分類號: | G06V10/764 | 分類號: | G06V10/764;G06V10/762;G06V10/774;G06N3/0464;G06N3/08;G06T3/60;G06T5/00 |
| 代理公司: | 南京眾聯(lián)專利代理有限公司 32206 | 代理人: | 許小莉 |
| 地址: | 210096 *** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 主動 學習 聲吶 圖像 目標 識別 方法 | ||
本發(fā)明公開了一種基于主動學習的聲吶圖像目標識別方法,包括如下步驟:步驟1:對聲吶圖像數(shù)據(jù)集進行數(shù)據(jù)增強處理以擴充數(shù)據(jù)集;步驟2:從步驟1劃分的訓練集中選出一組樣本進行標注,構成初始訓練集,并將這些初始訓練集的樣本從總的訓練集中剔除;步驟3.使用初始訓練集訓練YOLO模型;步驟4:在剔除初始訓練集后的剩余樣本訓練集中利用主動學習樣本選擇策略挑選一組樣本,將選擇出的樣本進行人工標注,加入訓練集訓練YOLO模型;步驟5:重復步驟4,直至剩余樣本訓練集中所有的樣本都被選擇;步驟6:YOLO模型訓練結束,保存權重、經(jīng)測試集測試以后輸出YOLO模型的精度。本發(fā)明極大地降低標注成本,并得到理想的精度。
技術領域:
本發(fā)明涉及一種基于主動學習的聲吶圖像目標識別方法,屬于計算機視覺、海洋學等多學科交叉領域。
背景技術:
聲吶圖像目標識別技術擁有十分廣闊的應用場景,如海洋生物的定位、分類與跟蹤,尸體、沉船、飛機殘骸等物體的打撈,海洋環(huán)境探測等,也多用于軍事方面,如潛艇、魚雷、蛙人等軍事目標的識別,具有很高的研究價值。
深度學習是一種使用多層網(wǎng)絡結構以習得目標更抽象、本質的特征的機器學習模式。相對于淺層學習來說,由于網(wǎng)絡結構更為復雜,深度學習更加有利于目標識別任務。當輸入訓練數(shù)據(jù)時,深度學習利用其網(wǎng)絡結構特性,逐層提取輸入數(shù)據(jù)的特征,從而使目標識別中的分類和定位任務的準確性得到較大的提升。近年來,深度學習在計算機視覺領域取得了重大突破,得到了廣泛的應用。
目前,深度學習技術已被用于聲吶圖像目標識別,但它的性能依賴于訓練樣本的數(shù)量和質量,要求訓練樣本數(shù)量大、標記準確。獲取大量標記樣本是一件耗時且昂貴的工作,在聲吶領域還需要有一定的專業(yè)背景知識的專家才能完成標注。另一方面,由于聲吶設備、傳感器等硬件的發(fā)展,獲取大量未標記樣本越來越容易。另外,過多的較低質量的標記樣本反而會降低模型的性能,甚至導致“過學習”問題。對于這樣一個問題,主動學習給出了其解決方案:在大量未標記樣本中依據(jù)一定的樣本選擇算法,從中挑選對模型的訓練價值較高的樣本交由專家標注后加入訓練集來提高模型的精度,以降低領域專家的工作量,而并非將所有的樣本進行標記后訓練模型。
發(fā)明內容
針對上述存在的問題,本發(fā)明提出了一種基于主動學習的聲吶圖像目標識別方法。通過主動學習策略,根據(jù)不同數(shù)據(jù)樣本對于學習模型的貢獻度不一樣的基本原理,制定多種選擇標記樣本的標準,選取一部分最有價值的數(shù)據(jù)交給人工進行標注,極大地降低標注成本,并得到理想的精度。
上述的目的通過以下技術方案實現(xiàn):
一種基于主動學習的聲吶圖像目標識別方法,該方法包括如下步驟:
步驟1:對聲吶圖像數(shù)據(jù)集進行數(shù)據(jù)增強處理以擴充數(shù)據(jù)集,采用“留出法”將數(shù)據(jù)集劃分為兩個互斥的集合,一個作為訓練集,一個作為測試集;
步驟2:從步驟1劃分的訓練集中選出一組樣本進行標注,構成初始訓練集,并將這些初始訓練集的樣本從總的訓練集中剔除;
步驟3.使用初始訓練集訓練YOLO模型;
步驟4:在剔除初始訓練集后的剩余樣本訓練集中利用主動學習樣本選擇策略挑選一組樣本,將選擇出的樣本進行人工標注,加入訓練集訓練YOLO模型,并將選出的樣本從剩余樣本訓練集中剔除;
步驟5:重復步驟4,直至剩余樣本訓練集中所有的樣本都被選擇;
步驟6:YOLO模型訓練結束,保存權重、經(jīng)測試集測試以后輸出YOLO模型的精度。
所述的基于主動學習的聲吶圖像目標識別方法,步驟1中所述對聲吶圖像數(shù)據(jù)集進行數(shù)據(jù)增強處理以擴充數(shù)據(jù)集,所述的數(shù)據(jù)增強處理的方法包括:隨機裁剪、調整曝光度、調整飽和度、調整色調、左右翻轉、上下翻轉、順時針旋轉90°、順時針旋轉180°、順時針旋轉270°。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于東南大學,未經(jīng)東南大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201911099760.1/2.html,轉載請聲明來源鉆瓜專利網(wǎng)。





