[發(fā)明專(zhuān)利]基于主動(dòng)學(xué)習(xí)的聲吶圖像目標(biāo)識(shí)別方法有效
| 申請(qǐng)?zhí)枺?/td> | 201911099760.1 | 申請(qǐng)日: | 2019-11-12 |
| 公開(kāi)(公告)號(hào): | CN110837870B | 公開(kāi)(公告)日: | 2023-05-12 |
| 發(fā)明(設(shè)計(jì))人: | 鄧雨田;姜龍玉 | 申請(qǐng)(專(zhuān)利權(quán))人: | 東南大學(xué) |
| 主分類(lèi)號(hào): | G06V10/764 | 分類(lèi)號(hào): | G06V10/764;G06V10/762;G06V10/774;G06N3/0464;G06N3/08;G06T3/60;G06T5/00 |
| 代理公司: | 南京眾聯(lián)專(zhuān)利代理有限公司 32206 | 代理人: | 許小莉 |
| 地址: | 210096 *** | 國(guó)省代碼: | 江蘇;32 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 基于 主動(dòng) 學(xué)習(xí) 聲吶 圖像 目標(biāo) 識(shí)別 方法 | ||
1.一種基于主動(dòng)學(xué)習(xí)的聲吶圖像目標(biāo)識(shí)別方法,其特征在于,該方法包括如下步驟:
步驟1:對(duì)聲吶圖像數(shù)據(jù)集進(jìn)行數(shù)據(jù)增強(qiáng)處理以擴(kuò)充數(shù)據(jù)集,采用“留出法”將數(shù)據(jù)集劃分為兩個(gè)互斥的集合,一個(gè)作為訓(xùn)練集,一個(gè)作為測(cè)試集;
步驟2:從步驟1劃分的訓(xùn)練集中選出一組樣本進(jìn)行標(biāo)注,構(gòu)成初始訓(xùn)練集,并將這些初始訓(xùn)練集的樣本從總的訓(xùn)練集中剔除;
步驟3.使用初始訓(xùn)練集訓(xùn)練YOLO模型;
步驟4:在剔除初始訓(xùn)練集后的剩余樣本訓(xùn)練集中利用主動(dòng)學(xué)習(xí)樣本選擇策略挑選一組樣本,將選擇出的樣本進(jìn)行人工標(biāo)注,加入訓(xùn)練集訓(xùn)練YOLO模型,并將選出的樣本從剩余樣本訓(xùn)練集中剔除;
步驟5:重復(fù)步驟4,直至剩余樣本訓(xùn)練集中所有的樣本都被選擇;
步驟6:YOLO模型訓(xùn)練結(jié)束,保存權(quán)重、經(jīng)測(cè)試集測(cè)試以后輸出YOLO模型的精度;
步驟4中所述利用主動(dòng)學(xué)習(xí)樣本選擇策略挑選一組樣本,其中所述主動(dòng)學(xué)習(xí)樣本選擇策略包括:基于分類(lèi)不確定性的樣本選擇策略;改進(jìn)的基于分類(lèi)不確定性樣本選擇策略;基于數(shù)據(jù)增強(qiáng)一致性的樣本選擇策略;
所述基于分類(lèi)不確定性的樣本選擇策略的具體步驟是:是從未標(biāo)注樣本集中選擇此時(shí)模型最難預(yù)測(cè)的樣本,即選擇后驗(yàn)概率最低的樣本,對(duì)于樣本預(yù)測(cè)結(jié)果的每一個(gè)邊界框,定義評(píng)價(jià)指標(biāo)分類(lèi)不確定性UB(B),其計(jì)算公式如下所示:
UB(B)=1-Pmax(B)
其中,Pmax(B)表示該邊界框中預(yù)測(cè)類(lèi)別概率中最大的概率值,
在一個(gè)樣本中,往往有多個(gè)預(yù)測(cè)邊界框,取所有預(yù)測(cè)邊界框分類(lèi)不確定性最大的邊界框的UB(B)值來(lái)代表此樣本的分類(lèi)不確定性UC(I),其算法流程如下:
a.用此時(shí)的模型檢測(cè)未標(biāo)注樣本集中的所有樣本,每個(gè)樣本得到其邊界框的預(yù)測(cè)值;
b.對(duì)于每個(gè)樣本,計(jì)算其分類(lèi)不確定性UC(I);
c.將所有未標(biāo)記樣本按照分類(lèi)不確定性UC(I)從大到小的順序排序;
d.根據(jù)排序選擇前n個(gè)樣本,交給專(zhuān)家標(biāo)注后加入訓(xùn)練集,其中,n為此輪規(guī)定的選擇樣本的數(shù)量;
所述改進(jìn)的基于分類(lèi)不確定性樣本選擇策略的具體步驟是:
定義分類(lèi)不確定性指標(biāo)為對(duì)于其計(jì)算公式如下所示:
UCnew=|log(Pmax)+αlog(s2)|
其中,α是一個(gè)權(quán)重參數(shù),表示最大概率值與各類(lèi)概率值離散程度在此指標(biāo)中所占的權(quán)重,經(jīng)過(guò)實(shí)驗(yàn)驗(yàn)證,α設(shè)置為0.2;s2表示預(yù)測(cè)所有類(lèi)的概率的方差,s2用來(lái)表示各類(lèi)概率值的離散程度,其計(jì)算公式如下所示:
其中,n表示總類(lèi)別數(shù),xi表示邊界框中第i類(lèi)的概率,為概率值的均值,其計(jì)算公式如下所示:
對(duì)于一個(gè)樣本來(lái)說(shuō),取所有預(yù)測(cè)邊界框分類(lèi)不確定性最大的邊界框的值來(lái)代表此樣本的新的分類(lèi)不確定性
所述基于數(shù)據(jù)增強(qiáng)一致性的樣本選擇策略的具體步驟為:選擇數(shù)據(jù)增強(qiáng)的方式為左右翻轉(zhuǎn),計(jì)算原圖I以及其翻轉(zhuǎn)圖像I′的預(yù)測(cè)誤差的算法的基本流程為:
a.將翻轉(zhuǎn)圖像I′的預(yù)測(cè)邊界框的位置做相應(yīng)的翻轉(zhuǎn)處理,翻轉(zhuǎn)圖像I′是圖像I經(jīng)過(guò)左右翻轉(zhuǎn)得到的,那么就需要將I′的預(yù)測(cè)邊界框也進(jìn)行左右翻轉(zhuǎn)處理;
b.根據(jù)圖像I與其翻轉(zhuǎn)圖像I′預(yù)測(cè)邊界框,計(jì)算預(yù)測(cè)類(lèi)別和位置的誤差,得到兩者誤差;
其中,若圖像I只需預(yù)測(cè)一個(gè)目標(biāo),則可將兩張圖像的預(yù)測(cè)邊界框直接進(jìn)行計(jì)算,但是對(duì)于一張圖像預(yù)測(cè)多個(gè)目標(biāo)的情況,需要判斷翻轉(zhuǎn)圖像中的預(yù)測(cè)框與原圖像中的預(yù)測(cè)框如何一一對(duì)應(yīng),對(duì)于一張圖像I,有n個(gè)預(yù)測(cè)邊界框B1,B2,...,Bn;其翻轉(zhuǎn)圖像I′,有m個(gè)預(yù)測(cè)邊界框B1,B2,...,Bm,其中,翻轉(zhuǎn)圖像I′的m個(gè)預(yù)測(cè)邊界框已經(jīng)過(guò)翻轉(zhuǎn)處理,對(duì)于每個(gè)預(yù)測(cè)邊界框,都有坐標(biāo)(x,y)表示邊界框中心的位置,判斷流程如下:
b1.計(jì)算圖像I的n個(gè)預(yù)測(cè)邊界框B1,B2,...,Bn與翻轉(zhuǎn)圖像I′的m個(gè)預(yù)測(cè)邊界框B1,B2,...,Bm的距離,得到dis(Bi,Bj),其中,1≤i≤n,1≤j≤m,dis(Bi,Bj)的計(jì)算如下所示:
其中1≤i≤n,1≤j≤m
b2.將步驟b1中計(jì)算所得的這m×n組距離按從小到大的順序排序,得到距離數(shù)組Dis;
b3.選取距離最小的一組邊界框Bp,Bq(1≤p≤n,1≤q≤m),認(rèn)為原圖I的邊界框Bp與翻轉(zhuǎn)圖像I′的邊界框Bq是相對(duì)應(yīng)的一組邊界框;
b4.將m×n組dis(Bi,Bj)距離中i=p或j=q的距離刪去;
b5.重復(fù)步驟b3-b4,直至數(shù)組Dis為空;
原圖與其翻轉(zhuǎn)圖像預(yù)測(cè)的類(lèi)別誤差記為L(zhǎng)class(I,I′),類(lèi)別誤差的計(jì)算如下所示:
其中,N為類(lèi)別總數(shù),實(shí)驗(yàn)中N=3;max(m,n)為m,n中較大的值;pij為原圖中第i個(gè)預(yù)測(cè)框,i=1,2,3,...,max(m,n),對(duì)于第j類(lèi)的預(yù)測(cè)概率值,j=1,2,...,N,若nm,則pij=0;pi′j為翻轉(zhuǎn)圖像中第i′個(gè)預(yù)測(cè)框?qū)τ诘趈類(lèi)的預(yù)測(cè)概率值,i′=1,2,3,...,max(m,n);若mn,貝pi′j=0,mi′n;若nm,則pij=0;
原圖與其翻轉(zhuǎn)圖像預(yù)測(cè)的定位誤差記為L(zhǎng)location(I,I′),類(lèi)別誤差的計(jì)算如下所示,其中,IoU(Bi,Bi′)為邊界框Bi,Bi′的交并比值:
定義基于數(shù)據(jù)增強(qiáng)一致性的樣本評(píng)價(jià)指標(biāo)SDA(I),其值為原圖以及其翻轉(zhuǎn)圖像的類(lèi)別誤差與預(yù)測(cè)框的定位誤差之和,計(jì)算公式如下所示:
SDA(I)=Lclass(I,I′)+αLlocation(I,I′)
其中,α是一個(gè)權(quán)重參數(shù),表示類(lèi)別誤差與定位誤差在此指標(biāo)中所占的權(quán)重,經(jīng)過(guò)實(shí)驗(yàn)驗(yàn)證,在本發(fā)明中α設(shè)置為1。
該專(zhuān)利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專(zhuān)利權(quán)人授權(quán)。該專(zhuān)利全部權(quán)利屬于東南大學(xué),未經(jīng)東南大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買(mǎi)此專(zhuān)利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201911099760.1/1.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專(zhuān)利網(wǎng)。
- 主動(dòng)元件及主動(dòng)元件陣列基板
- 主動(dòng)降噪系統(tǒng)、主動(dòng)降噪耳機(jī)及主動(dòng)降噪方法
- 主動(dòng)定位方法及主動(dòng)定位系統(tǒng)
- 主動(dòng)降噪系統(tǒng)及主動(dòng)降噪耳機(jī)
- 主動(dòng)清除系統(tǒng)和主動(dòng)清除方法
- 主動(dòng)筆控制方法及主動(dòng)筆
- 筆尖、主動(dòng)筆和主動(dòng)筆系統(tǒng)
- 主動(dòng)降噪耳機(jī)和主動(dòng)降噪方法
- 主動(dòng)導(dǎo)管及主動(dòng)導(dǎo)管系統(tǒng)
- 主動(dòng)降噪算法及主動(dòng)降噪耳機(jī)
- 根據(jù)用戶(hù)學(xué)習(xí)效果動(dòng)態(tài)變化下載學(xué)習(xí)數(shù)據(jù)的系統(tǒng)及方法
- 用于智能個(gè)人化學(xué)習(xí)服務(wù)的方法
- 漸進(jìn)式學(xué)習(xí)管理方法及漸進(jìn)式學(xué)習(xí)系統(tǒng)
- 輔助學(xué)習(xí)的方法及裝置
- 基于人工智能的課程推薦方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 基于強(qiáng)化學(xué)習(xí)的自適應(yīng)移動(dòng)學(xué)習(xí)路徑生成方法
- 一種線(xiàn)上視頻學(xué)習(xí)系統(tǒng)
- 一種基于校園大數(shù)據(jù)的自適應(yīng)學(xué)習(xí)方法、裝置及設(shè)備
- 一種學(xué)習(xí)方案推薦方法、裝置、設(shè)備和存儲(chǔ)介質(zhì)
- 游戲?qū)W習(xí)效果評(píng)測(cè)方法及系統(tǒng)





