[發(fā)明專利]三維圖像神經(jīng)網(wǎng)絡(luò)模型的訓(xùn)練方法、裝置和計(jì)算機(jī)設(shè)備在審
| 申請(qǐng)?zhí)枺?/td> | 202110349381.4 | 申請(qǐng)日: | 2021-03-31 |
| 公開(kāi)(公告)號(hào): | CN112949761A | 公開(kāi)(公告)日: | 2021-06-11 |
| 發(fā)明(設(shè)計(jì))人: | 尹威華;劉智勇;喬紅;王建城;鄒俊成 | 申請(qǐng)(專利權(quán))人: | 東莞中國(guó)科學(xué)院云計(jì)算產(chǎn)業(yè)技術(shù)創(chuàng)新與育成中心 |
| 主分類號(hào): | G06K9/62 | 分類號(hào): | G06K9/62;G06N3/04;G06N3/08 |
| 代理公司: | 廣州華進(jìn)聯(lián)合專利商標(biāo)代理有限公司 44224 | 代理人: | 方高明 |
| 地址: | 523000 廣東省東莞*** | 國(guó)省代碼: | 廣東;44 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 三維 圖像 神經(jīng)網(wǎng)絡(luò) 模型 訓(xùn)練 方法 裝置 計(jì)算機(jī) 設(shè)備 | ||
本申請(qǐng)涉及一種三維圖像神經(jīng)網(wǎng)絡(luò)模型的訓(xùn)練方法、裝置和計(jì)算機(jī)設(shè)備。方法包括:獲取第一時(shí)刻的樣本三維圖像、第二時(shí)刻的樣本三維圖像和第三時(shí)刻的樣本三維圖像;將第一時(shí)刻的樣本三維圖像和第二時(shí)刻的樣本三維圖像輸入初始三維圖像神經(jīng)網(wǎng)絡(luò)模型進(jìn)行預(yù)測(cè),得到第三時(shí)刻的預(yù)測(cè)三維圖像;比較第三時(shí)刻的預(yù)測(cè)三維圖像和第三時(shí)刻的樣本三維圖像,得到平均絕對(duì)誤差損失、姿態(tài)損失和位置損失;根據(jù)平均絕對(duì)誤差損失、姿態(tài)損失和位置損失得到綜合損失;根據(jù)綜合損失調(diào)整初始三維圖像神經(jīng)網(wǎng)絡(luò)模型的權(quán)重,繼續(xù)訓(xùn)練,滿足預(yù)設(shè)條件時(shí),得到訓(xùn)練后的三維圖像神經(jīng)網(wǎng)絡(luò)模型。本方案能夠提高三維圖像的預(yù)測(cè)精度。
技術(shù)領(lǐng)域
本申請(qǐng)涉及三維圖像處理技術(shù)領(lǐng)域,特別是涉及一種三維圖像神經(jīng)網(wǎng)絡(luò)模型的訓(xùn)練方法、裝置和計(jì)算機(jī)設(shè)備。
背景技術(shù)
隨著深度學(xué)習(xí)技術(shù)、硬件技術(shù)的發(fā)展,三維神經(jīng)網(wǎng)絡(luò)技術(shù)快速發(fā)展,已廣泛應(yīng)用于多個(gè)領(lǐng)域,如工業(yè)中引導(dǎo)機(jī)器人控制、輔助智能汽車(chē)自動(dòng)駕駛以及三維工件的缺陷檢測(cè)等領(lǐng)域。例如,當(dāng)工業(yè)機(jī)器人搭載工業(yè)相機(jī)抓取目標(biāo)遇到遮擋時(shí),可以使用三維生成網(wǎng)絡(luò)生成出目標(biāo)未被遮擋的狀態(tài),以引導(dǎo)機(jī)器人完成操作。當(dāng)無(wú)人車(chē)自動(dòng)駕駛時(shí)突然有另一臺(tái)車(chē)的部分駛?cè)胍曇胺秶梢酝ㄟ^(guò)三維生成網(wǎng)絡(luò)預(yù)測(cè)生成駛?cè)胲?chē)輛可能的行駛路徑,以輔助無(wú)人車(chē)提前減速。
三維圖像神經(jīng)網(wǎng)絡(luò)在使用之前需要經(jīng)過(guò)訓(xùn)練以提高神經(jīng)網(wǎng)絡(luò)生成的準(zhǔn)確性。傳統(tǒng)技術(shù)中的圖像神經(jīng)網(wǎng)絡(luò)訓(xùn)練所得到的神經(jīng)網(wǎng)絡(luò)模型生成的預(yù)測(cè)圖像精度不高。
發(fā)明內(nèi)容
基于此,有必要針對(duì)上述技術(shù)問(wèn)題,提供一種能夠提高三維圖像預(yù)測(cè)精度的三維圖像神經(jīng)網(wǎng)絡(luò)模型的訓(xùn)練方法、裝置和計(jì)算機(jī)設(shè)備。
一種三維圖像神經(jīng)網(wǎng)絡(luò)模型的訓(xùn)練方法,包括:
獲取第一時(shí)刻的樣本三維圖像、第二時(shí)刻的樣本三維圖像和第三時(shí)刻的樣本三維圖像;
將第一時(shí)刻的樣本三維圖像和第二時(shí)刻的樣本三維圖像輸入初始三維圖像神經(jīng)網(wǎng)絡(luò)模型進(jìn)行預(yù)測(cè),得到第三時(shí)刻的預(yù)測(cè)三維圖像;
比較第三時(shí)刻的預(yù)測(cè)三維圖像和第三時(shí)刻的樣本三維圖像,得到平均絕對(duì)誤差損失、姿態(tài)損失和位置損失;
根據(jù)平均絕對(duì)誤差損失、姿態(tài)損失和位置損失得到綜合損失;
根據(jù)綜合損失調(diào)整初始三維圖像神經(jīng)網(wǎng)絡(luò)模型的權(quán)重,繼續(xù)訓(xùn)練,滿足預(yù)設(shè)條件時(shí),得到訓(xùn)練后的三維圖像神經(jīng)網(wǎng)絡(luò)模型。
在其中一個(gè)實(shí)施例中,獲取第一時(shí)刻的樣本三維圖像、第二時(shí)刻的樣本三維圖像和第三時(shí)刻的樣本三維圖像,包括:
獲取拍攝對(duì)象在第一時(shí)刻、第二時(shí)刻和第三時(shí)刻的樣本圖像,第一時(shí)刻、第二時(shí)刻和第三時(shí)刻是三個(gè)連續(xù)時(shí)刻;
獲取拍攝對(duì)象在第一時(shí)刻、第二時(shí)刻和第三時(shí)刻的樣本圖像的深度信息和顏色信息;
根據(jù)拍攝對(duì)象在第一時(shí)刻、第二時(shí)刻和第三時(shí)刻的樣本圖像的深度信息和顏色信息,對(duì)拍攝對(duì)象在第一時(shí)刻、第二時(shí)刻和第三時(shí)刻的樣本圖像進(jìn)行三維重建,得到第一時(shí)刻的樣本三維圖像、第二時(shí)刻的樣本三維圖像和第三時(shí)刻的樣本三維圖像。
在其中一個(gè)實(shí)施例中,根據(jù)平均絕對(duì)誤差損失、姿態(tài)損失和位置損失得到綜合損失,包括:
將平均絕對(duì)誤差損失、姿態(tài)損失和位置損失進(jìn)行加權(quán)求和,得到綜合損失。
在其中一個(gè)實(shí)施例中,平均絕對(duì)誤差損失為第三時(shí)刻的預(yù)測(cè)三維圖像中的像素值與第三時(shí)刻的樣本三維圖像中的像素值之間的平均絕對(duì)誤差;姿態(tài)損失為第三時(shí)刻的預(yù)測(cè)三維圖像中目標(biāo)的像素值和第三時(shí)刻的樣本三維圖像中目標(biāo)的像素值一樣的個(gè)數(shù)與第三時(shí)刻的預(yù)測(cè)三維圖像或第三時(shí)刻的樣本三維圖像中目標(biāo)所包含像素值的個(gè)數(shù)的比值;位置損失為第三時(shí)刻的預(yù)測(cè)三維圖像和第三時(shí)刻的樣本三維圖像的三系位置坐標(biāo)差值的絕對(duì)值的和。
一種三維圖像生成方法,包括:
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于東莞中國(guó)科學(xué)院云計(jì)算產(chǎn)業(yè)技術(shù)創(chuàng)新與育成中心,未經(jīng)東莞中國(guó)科學(xué)院云計(jì)算產(chǎn)業(yè)技術(shù)創(chuàng)新與育成中心許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買(mǎi)此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110349381.4/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06K 數(shù)據(jù)識(shí)別;數(shù)據(jù)表示;記錄載體;記錄載體的處理
G06K9-00 用于閱讀或識(shí)別印刷或書(shū)寫(xiě)字符或者用于識(shí)別圖形,例如,指紋的方法或裝置
G06K9-03 .錯(cuò)誤的檢測(cè)或校正,例如,用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標(biāo)記或含有代碼標(biāo)記的打印字符的,例如,由不同形狀的各個(gè)筆畫(huà)組成的,而且每個(gè)筆畫(huà)表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理,即無(wú)須判定關(guān)于圖像的同一性而進(jìn)行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合
- 一種三維彩色物品制作方法
- 三維內(nèi)容顯示的方法、裝置和系統(tǒng)
- 三維對(duì)象搜索方法、裝置及系統(tǒng)
- 三維會(huì)話數(shù)據(jù)展示方法、裝置、存儲(chǔ)介質(zhì)和計(jì)算機(jī)設(shè)備
- 一種三維模型處理方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)
- 用于基于分布式賬本技術(shù)的三維打印的去中心化供應(yīng)鏈
- 標(biāo)記數(shù)據(jù)的獲取方法及裝置、訓(xùn)練方法及裝置、醫(yī)療設(shè)備
- 一種基于5G網(wǎng)絡(luò)的光場(chǎng)三維浸入式體驗(yàn)信息傳輸方法及系統(tǒng)
- 用于機(jī)器人生產(chǎn)系統(tǒng)仿真的三維場(chǎng)景管理與文件存儲(chǔ)方法
- 基于三維形狀知識(shí)圖譜的三維模型檢索方法及裝置
- 彩色圖像和單色圖像的圖像處理
- 圖像編碼/圖像解碼方法以及圖像編碼/圖像解碼裝置
- 圖像處理裝置、圖像形成裝置、圖像讀取裝置、圖像處理方法
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序以及圖像解碼程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序、以及圖像解碼程序
- 圖像形成設(shè)備、圖像形成系統(tǒng)和圖像形成方法
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 硬件神經(jīng)網(wǎng)絡(luò)轉(zhuǎn)換方法、計(jì)算裝置、軟硬件協(xié)作系統(tǒng)
- 生成較大神經(jīng)網(wǎng)絡(luò)
- 神經(jīng)網(wǎng)絡(luò)的生成方法、生成裝置和電子設(shè)備
- 一種舌診方法、裝置、計(jì)算設(shè)備及計(jì)算機(jī)存儲(chǔ)介質(zhì)
- 學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)
- 脈沖神經(jīng)網(wǎng)絡(luò)轉(zhuǎn)換方法及相關(guān)轉(zhuǎn)換芯片
- 圖像處理方法、裝置、可讀存儲(chǔ)介質(zhì)和計(jì)算機(jī)設(shè)備
- 一種適應(yīng)目標(biāo)數(shù)據(jù)集的網(wǎng)絡(luò)模型微調(diào)方法、系統(tǒng)、終端和存儲(chǔ)介質(zhì)
- 用于重構(gòu)人工神經(jīng)網(wǎng)絡(luò)的處理器及其操作方法、電氣設(shè)備
- 一種圖像神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)的優(yōu)化方法及裝置





