[發(fā)明專利]一種基于深度強(qiáng)化學(xué)習(xí)的圖像數(shù)據(jù)自動(dòng)化標(biāo)注方法及系統(tǒng)在審
| 申請(qǐng)?zhí)枺?/td> | 202110355995.3 | 申請(qǐng)日: | 2021-04-01 |
| 公開(公告)號(hào): | CN113076950A | 公開(公告)日: | 2021-07-06 |
| 發(fā)明(設(shè)計(jì))人: | 何弢;廖文龍;章舸帆 | 申請(qǐng)(專利權(quán))人: | 安徽酷哇機(jī)器人有限公司;蕪湖酷哇機(jī)器人產(chǎn)業(yè)技術(shù)研究院有限公司 |
| 主分類號(hào): | G06K9/32 | 分類號(hào): | G06K9/32;G06K9/34;G06K9/62;G06N3/04;G06N3/08;G06N20/00 |
| 代理公司: | 上海段和段律師事務(wù)所 31334 | 代理人: | 李佳俊;郭國(guó)中 |
| 地址: | 241000 安徽省蕪湖市*** | 國(guó)省代碼: | 安徽;34 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 深度 強(qiáng)化 學(xué)習(xí) 圖像 數(shù)據(jù) 自動(dòng)化 標(biāo)注 方法 系統(tǒng) | ||
1.一種基于深度強(qiáng)化學(xué)習(xí)的圖像數(shù)據(jù)自動(dòng)化標(biāo)注方法,其特征在于,所述方法包括:
深度學(xué)習(xí)步驟:自動(dòng)生成目標(biāo)檢測(cè)、實(shí)例分割粗糙預(yù)標(biāo)注;
強(qiáng)化學(xué)習(xí)步驟:自動(dòng)修正標(biāo)注結(jié)果、對(duì)粗糙預(yù)標(biāo)注結(jié)果進(jìn)行微調(diào)。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述深度學(xué)習(xí)步驟包括:
CNN特征提取步驟:利用經(jīng)過預(yù)訓(xùn)練的卷積神經(jīng)網(wǎng)絡(luò),提取圖像的紋理、語義信息,輸出多尺度特征圖;
多尺度特征融合步驟:對(duì)上述輸出的多尺度特征圖,進(jìn)行融合計(jì)算,輸出經(jīng)過融合處理的多尺度特征圖;
目標(biāo)檢測(cè)頭或?qū)嵗指铑^步驟:輸入融合后的多尺度特征圖,經(jīng)過運(yùn)算初步得到目標(biāo)邊界框位置或目標(biāo)掩膜;
結(jié)果后處理步驟:過濾上一步驟計(jì)算得到的目標(biāo)邊界框,去除低置信度或重復(fù)檢測(cè)到的目標(biāo)邊界框;對(duì)得到的目標(biāo)掩膜提取外輪廓。
3.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述強(qiáng)化學(xué)習(xí)步驟包括:
特征重提取步驟:使用上述深度學(xué)習(xí)算法步驟獲得的目標(biāo)結(jié)果信息,從原始輸入圖片、多尺度特征圖或融合多尺度特征圖上重新采樣,提取更精細(xì)的目標(biāo)特征;
策略函數(shù)神經(jīng)網(wǎng)絡(luò):函數(shù)π(ai|si,θ),輸入精細(xì)化目標(biāo)特征,可以輸出對(duì)粗糙預(yù)標(biāo)注結(jié)果的調(diào)整動(dòng)作下應(yīng)當(dāng)進(jìn)行的微調(diào)動(dòng)作的概率分布,通過神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn),該神經(jīng)網(wǎng)絡(luò)包含參數(shù)θ,該參數(shù)通過強(qiáng)化學(xué)習(xí)實(shí)時(shí)更新;
動(dòng)作選擇步驟:給定上述動(dòng)作價(jià)值函數(shù)以及精細(xì)化目標(biāo)特征,對(duì)所有可能的所述調(diào)整動(dòng)作計(jì)算對(duì)應(yīng)的價(jià)值回報(bào)估計(jì),根據(jù)特定的動(dòng)作選擇步驟策略,選擇一個(gè)微調(diào)動(dòng)作輸出;
結(jié)果微調(diào)步驟:將上述選擇的微調(diào)動(dòng)作作用于深度學(xué)習(xí)模型給出的原始結(jié)果,得到更新的目標(biāo)檢測(cè)或?qū)嵗指罱Y(jié)果;
獎(jiǎng)勵(lì)計(jì)算步驟:通過對(duì)比微調(diào)前、后的結(jié)果和標(biāo)注員的修改結(jié)果,或直接通過標(biāo)注員的修改動(dòng)作,對(duì)強(qiáng)化學(xué)習(xí)算法步驟做出的微調(diào)動(dòng)作做出評(píng)價(jià),作為實(shí)時(shí)獎(jiǎng)勵(lì)r;獎(jiǎng)勵(lì)的計(jì)算可以采用如下方式,或以下幾類方式的按比例求和:
(1)、以標(biāo)注員的標(biāo)注結(jié)果為真值,微調(diào)動(dòng)作作用前后,被標(biāo)注圖像的目標(biāo)檢測(cè)、實(shí)例分割結(jié)果的平均準(zhǔn)確率mAP指標(biāo)提升比例值或差值;
(2)、標(biāo)注員鼠標(biāo)拖動(dòng)距離;
(3)、鼠標(biāo)點(diǎn)擊次數(shù)等操作頻次;
在線優(yōu)化器:根據(jù)策略梯度算法,對(duì)策略函數(shù)的參數(shù)進(jìn)行優(yōu)化。
4.根據(jù)權(quán)利要求3所述的方法,其特征在于,所述動(dòng)作選擇步驟中的微調(diào)動(dòng)作包括:
對(duì)于目標(biāo)檢測(cè)模型,微調(diào)動(dòng)作可表達(dá)為a=(δtop,δbottom,δleft,δright),代表的含義分別為:
δtop:上邊框調(diào)整距離與當(dāng)前框高度的比值之對(duì)數(shù);
δbottom:下邊框調(diào)整距離與當(dāng)前框高度的比值之對(duì)數(shù);
δleft:左邊框調(diào)整距離與當(dāng)前框?qū)挾鹊谋戎抵畬?duì)數(shù);
δright:右邊框調(diào)整距離與當(dāng)前框?qū)挾鹊谋戎抵畬?duì)數(shù);
對(duì)于實(shí)例分割模型,微調(diào)動(dòng)作可表達(dá)為a=(δx1,δy1,δx2,δy2…),其中xi,yi代表實(shí)例分割目標(biāo)外包絡(luò)線上的第i個(gè)頂點(diǎn),a中各項(xiàng)代表的含義:
δxi:第i個(gè)頂點(diǎn)的微調(diào)位移沿x方向的偏移量與當(dāng)前目標(biāo)寬度的比值之對(duì)數(shù);
δxi:第i個(gè)頂點(diǎn)的微調(diào)位移沿y方向的偏移量與當(dāng)前目標(biāo)高度的比值之對(duì)數(shù);
動(dòng)作選擇步驟照策略函數(shù)給出的不同動(dòng)作的概率分布,按概率抽樣得到最后的微調(diào)動(dòng)作。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于安徽酷哇機(jī)器人有限公司;蕪湖酷哇機(jī)器人產(chǎn)業(yè)技術(shù)研究院有限公司,未經(jīng)安徽酷哇機(jī)器人有限公司;蕪湖酷哇機(jī)器人產(chǎn)業(yè)技術(shù)研究院有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110355995.3/1.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 上一篇:一種路橋施工用起降設(shè)備
- 下一篇:電阻器
- 同類專利
- 專利分類
G06K 數(shù)據(jù)識(shí)別;數(shù)據(jù)表示;記錄載體;記錄載體的處理
G06K9-00 用于閱讀或識(shí)別印刷或書寫字符或者用于識(shí)別圖形,例如,指紋的方法或裝置
G06K9-03 .錯(cuò)誤的檢測(cè)或校正,例如,用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標(biāo)記或含有代碼標(biāo)記的打印字符的,例如,由不同形狀的各個(gè)筆畫組成的,而且每個(gè)筆畫表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理,即無須判定關(guān)于圖像的同一性而進(jìn)行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合
- 根據(jù)用戶學(xué)習(xí)效果動(dòng)態(tài)變化下載學(xué)習(xí)數(shù)據(jù)的系統(tǒng)及方法
- 用于智能個(gè)人化學(xué)習(xí)服務(wù)的方法
- 漸進(jìn)式學(xué)習(xí)管理方法及漸進(jìn)式學(xué)習(xí)系統(tǒng)
- 輔助學(xué)習(xí)的方法及裝置
- 基于人工智能的課程推薦方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 基于強(qiáng)化學(xué)習(xí)的自適應(yīng)移動(dòng)學(xué)習(xí)路徑生成方法
- 一種線上視頻學(xué)習(xí)系統(tǒng)
- 一種基于校園大數(shù)據(jù)的自適應(yīng)學(xué)習(xí)方法、裝置及設(shè)備
- 一種學(xué)習(xí)方案推薦方法、裝置、設(shè)備和存儲(chǔ)介質(zhì)
- 游戲?qū)W習(xí)效果評(píng)測(cè)方法及系統(tǒng)





