[發(fā)明專(zhuān)利]三維關(guān)鍵點(diǎn)預(yù)測(cè)及深度學(xué)習(xí)模型訓(xùn)練方法、裝置及設(shè)備在審
| 申請(qǐng)?zhí)枺?/td> | 201911417835.6 | 申請(qǐng)日: | 2019-12-31 |
| 公開(kāi)(公告)號(hào): | CN111160375A | 公開(kāi)(公告)日: | 2020-05-15 |
| 發(fā)明(設(shè)計(jì))人: | 劉思陽(yáng) | 申請(qǐng)(專(zhuān)利權(quán))人: | 北京奇藝世紀(jì)科技有限公司 |
| 主分類(lèi)號(hào): | G06K9/46 | 分類(lèi)號(hào): | G06K9/46;G06K9/62 |
| 代理公司: | 北京柏杉松知識(shí)產(chǎn)權(quán)代理事務(wù)所(普通合伙) 11413 | 代理人: | 李欣;丁蕓 |
| 地址: | 100080 北京市海淀區(qū)*** | 國(guó)省代碼: | 北京;11 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 三維 關(guān)鍵 預(yù)測(cè) 深度 學(xué)習(xí) 模型 訓(xùn)練 方法 裝置 設(shè)備 | ||
本申請(qǐng)實(shí)施例提供了三維關(guān)鍵點(diǎn)預(yù)測(cè)及深度學(xué)習(xí)模型訓(xùn)練方法、裝置及設(shè)備,該方法包括:獲取包含待檢測(cè)對(duì)象的RGB圖像;基于RGB圖像,獲取待檢測(cè)對(duì)象的二維關(guān)鍵點(diǎn)信息及每個(gè)二維關(guān)鍵點(diǎn)對(duì)應(yīng)的熱度圖像;利用預(yù)先訓(xùn)練的深度學(xué)習(xí)模型,對(duì)RGB圖像、二維關(guān)鍵點(diǎn)信息及熱度圖像進(jìn)行關(guān)聯(lián)分析,得到待檢測(cè)對(duì)象的三維關(guān)鍵點(diǎn)信息的預(yù)測(cè)值。利用預(yù)先訓(xùn)練的深度學(xué)習(xí)模型對(duì)待檢測(cè)對(duì)象的RGB圖像、二維關(guān)鍵點(diǎn)信息及熱度圖像進(jìn)行關(guān)聯(lián)分析,相比于僅對(duì)二維關(guān)鍵點(diǎn)信息進(jìn)行分析,能夠從RGB圖像及熱度圖像中獲取除二維關(guān)鍵點(diǎn)信息外的其他用于預(yù)測(cè)三維關(guān)鍵點(diǎn)信息的數(shù)據(jù),從而能夠提高三維關(guān)鍵點(diǎn)信息預(yù)測(cè)的準(zhǔn)確性。
技術(shù)領(lǐng)域
本申請(qǐng)涉及計(jì)算機(jī)技術(shù)領(lǐng)域,特別是涉及三維關(guān)鍵點(diǎn)預(yù)測(cè)及深度學(xué)習(xí)模型訓(xùn)練方法、裝置及設(shè)備。
背景技術(shù)
隨著計(jì)算機(jī)視覺(jué)技術(shù)的發(fā)展,特別是深度學(xué)習(xí)算法的出現(xiàn),基于圖像的人工智能技術(shù)快速崛起。
3D(Dimension,維度)關(guān)鍵點(diǎn)的識(shí)別是計(jì)算機(jī)視覺(jué)領(lǐng)域中的一個(gè)分支算法,可用于人體意圖識(shí)別,人體3D重建,人體動(dòng)作捕捉等應(yīng)用。隨著深度學(xué)習(xí)算法的發(fā)展,2D關(guān)鍵點(diǎn)算法逐漸成熟,但在預(yù)測(cè)人體的3D關(guān)鍵點(diǎn)任務(wù)上,仍存在很多問(wèn)題。
現(xiàn)有利用2D圖像提取3D關(guān)鍵點(diǎn)的技術(shù)中,首先對(duì)2D圖像進(jìn)行分析獲取2D關(guān)鍵點(diǎn),然后通過(guò)將2D關(guān)鍵點(diǎn)的坐標(biāo)信息輸入到預(yù)先訓(xùn)練的深度學(xué)習(xí)算法中去預(yù)測(cè)3D關(guān)鍵點(diǎn)的位置坐標(biāo),但是因?yàn)?D關(guān)鍵點(diǎn)本身包含的信息有限,導(dǎo)致3D關(guān)鍵點(diǎn)信息的預(yù)測(cè)準(zhǔn)確性差。
發(fā)明內(nèi)容
本申請(qǐng)實(shí)施例的目的在于提供一種三維關(guān)鍵點(diǎn)預(yù)測(cè)及深度學(xué)習(xí)模型訓(xùn)練方法、裝置及設(shè)備,以實(shí)現(xiàn)提高3D關(guān)鍵點(diǎn)信息預(yù)測(cè)的準(zhǔn)確度。具體技術(shù)方案如下:
第一方面,本申請(qǐng)實(shí)施例提供了一種三維關(guān)鍵點(diǎn)預(yù)測(cè)方法,所述方法包括:
獲取包含待檢測(cè)對(duì)象的RGB圖像;
基于所述RGB圖像,獲取所述待檢測(cè)對(duì)象的二維關(guān)鍵點(diǎn)信息及每個(gè)二維關(guān)鍵點(diǎn)對(duì)應(yīng)的熱度圖像;
利用預(yù)先訓(xùn)練的深度學(xué)習(xí)模型,對(duì)所述RGB圖像、所述二維關(guān)鍵點(diǎn)信息及所述熱度圖像進(jìn)行關(guān)聯(lián)分析,得到所述待檢測(cè)對(duì)象的三維關(guān)鍵點(diǎn)信息的預(yù)測(cè)值。
在一種可能的實(shí)施方式中,所述利用預(yù)先訓(xùn)練的深度學(xué)習(xí)模型,對(duì)所述RGB圖像、所述二維關(guān)鍵點(diǎn)信息及所述熱度圖像進(jìn)行關(guān)聯(lián)分析,得到所述待檢測(cè)對(duì)象的三維關(guān)鍵點(diǎn)信息的預(yù)測(cè)值,包括:
利用所述深度學(xué)習(xí)模型,對(duì)所述RGB圖像的矩陣及所述熱度圖像的矩陣進(jìn)行拼接,得到目標(biāo)拼接矩陣;
對(duì)所述目標(biāo)拼接矩陣進(jìn)行特征提取,得到初始圖像特征;
對(duì)所述初始圖像特征進(jìn)行維度變換,得到目標(biāo)圖像特征;
對(duì)所述二維關(guān)鍵點(diǎn)信息進(jìn)行分析,得到目標(biāo)關(guān)鍵點(diǎn)特征;
對(duì)所述目標(biāo)圖像特征及所述目標(biāo)關(guān)鍵點(diǎn)特征進(jìn)行關(guān)聯(lián)分析,得到所述待檢測(cè)對(duì)象的三維關(guān)鍵點(diǎn)信息的預(yù)測(cè)值。
第二方面,本申請(qǐng)實(shí)施例提供了一種深度學(xué)習(xí)模型訓(xùn)練方法,所述方法包括:
獲取待訓(xùn)練的深度學(xué)習(xí)模型;
在預(yù)設(shè)樣本集合中選取一組樣本圖像組,其中,所述樣本圖像組包括樣本RGB圖像、樣本二維關(guān)鍵點(diǎn)信息、每個(gè)樣本二維關(guān)鍵點(diǎn)對(duì)應(yīng)的樣本熱度圖像及真值三維關(guān)鍵點(diǎn)信息,所述樣本二維關(guān)鍵點(diǎn)信息通過(guò)對(duì)所述樣本RGB圖像進(jìn)行二維關(guān)鍵點(diǎn)檢測(cè)得到;
利用所述深度學(xué)習(xí)模型,對(duì)當(dāng)前選取的樣本RGB圖像、樣本熱度圖像及樣本二維關(guān)鍵點(diǎn)信息進(jìn)行關(guān)聯(lián)分析,得到預(yù)測(cè)三維關(guān)鍵點(diǎn)信息;
根據(jù)所述真值三維關(guān)鍵點(diǎn)信息及所述預(yù)設(shè)三維關(guān)鍵點(diǎn)信息,計(jì)算所述深度學(xué)習(xí)模型的當(dāng)前損失;
該專(zhuān)利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專(zhuān)利權(quán)人授權(quán)。該專(zhuān)利全部權(quán)利屬于北京奇藝世紀(jì)科技有限公司,未經(jīng)北京奇藝世紀(jì)科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買(mǎi)此專(zhuān)利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201911417835.6/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專(zhuān)利網(wǎng)。
- 上一篇:電子標(biāo)簽的關(guān)聯(lián)方法、裝置、電子設(shè)備及存儲(chǔ)介質(zhì)
- 下一篇:一種貫流風(fēng)葉裝配檢測(cè)方法、計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)及空調(diào)
- 同類(lèi)專(zhuān)利
- 專(zhuān)利分類(lèi)
G06K 數(shù)據(jù)識(shí)別;數(shù)據(jù)表示;記錄載體;記錄載體的處理
G06K9-00 用于閱讀或識(shí)別印刷或書(shū)寫(xiě)字符或者用于識(shí)別圖形,例如,指紋的方法或裝置
G06K9-03 .錯(cuò)誤的檢測(cè)或校正,例如,用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標(biāo)記或含有代碼標(biāo)記的打印字符的,例如,由不同形狀的各個(gè)筆畫(huà)組成的,而且每個(gè)筆畫(huà)表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理,即無(wú)須判定關(guān)于圖像的同一性而進(jìn)行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合
- 一種三維彩色物品制作方法
- 三維內(nèi)容顯示的方法、裝置和系統(tǒng)
- 三維對(duì)象搜索方法、裝置及系統(tǒng)
- 三維會(huì)話(huà)數(shù)據(jù)展示方法、裝置、存儲(chǔ)介質(zhì)和計(jì)算機(jī)設(shè)備
- 一種三維模型處理方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)
- 用于基于分布式賬本技術(shù)的三維打印的去中心化供應(yīng)鏈
- 標(biāo)記數(shù)據(jù)的獲取方法及裝置、訓(xùn)練方法及裝置、醫(yī)療設(shè)備
- 一種基于5G網(wǎng)絡(luò)的光場(chǎng)三維浸入式體驗(yàn)信息傳輸方法及系統(tǒng)
- 用于機(jī)器人生產(chǎn)系統(tǒng)仿真的三維場(chǎng)景管理與文件存儲(chǔ)方法
- 基于三維形狀知識(shí)圖譜的三維模型檢索方法及裝置
- 關(guān)鍵詞輸出設(shè)備和關(guān)鍵詞輸出方法
- 標(biāo)有關(guān)鍵點(diǎn)和關(guān)鍵線(xiàn)的人臺(tái)
- 關(guān)鍵詞質(zhì)量度的檢測(cè)方法和裝置
- 關(guān)鍵詞排名的檢測(cè)方法和裝置
- 關(guān)鍵點(diǎn)識(shí)別
- 磁性開(kāi)關(guān)鍵
- 面板開(kāi)關(guān)鍵
- 關(guān)鍵短語(yǔ)提取方法以及關(guān)鍵短語(yǔ)提取系統(tǒng)
- 通信行為檢測(cè)方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 一種長(zhǎng)尾關(guān)鍵詞識(shí)別方法、關(guān)鍵詞搜索方法及計(jì)算機(jī)設(shè)備
- 圖像編碼裝置、圖像編碼方法、圖像譯碼裝置、圖像譯碼方法、程序以及記錄介質(zhì)
- 圖像編碼裝置、圖像編碼方法、圖像譯碼裝置、圖像譯碼方法
- 圖像編碼裝置、圖像編碼方法、圖像譯碼裝置、圖像譯碼方法
- 基于時(shí)間序列預(yù)測(cè)模型適用性量化的預(yù)測(cè)模型選擇方法
- 圖像編碼裝置、圖像編碼方法、圖像譯碼裝置、圖像譯碼方法
- 分類(lèi)預(yù)測(cè)方法及裝置、預(yù)測(cè)模型訓(xùn)練方法及裝置
- 幀內(nèi)預(yù)測(cè)的方法及裝置
- 圖像預(yù)測(cè)方法及裝置、電子設(shè)備和存儲(chǔ)介質(zhì)
- 文本預(yù)測(cè)方法、裝置以及電子設(shè)備
- 模型融合方法、預(yù)測(cè)方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)





