[發(fā)明專利]一種圖像表示學習方法及系統(tǒng)在審
| 申請?zhí)枺?/td> | 202011632703.8 | 申請日: | 2020-12-31 |
| 公開(公告)號: | CN112634174A | 公開(公告)日: | 2021-04-09 |
| 發(fā)明(設計)人: | 胡郡郡 | 申請(專利權)人: | 上海明略人工智能(集團)有限公司 |
| 主分類號: | G06T5/00 | 分類號: | G06T5/00;G06T7/181;G06N3/04;G06N3/08 |
| 代理公司: | 青島清泰聯(lián)信知識產(chǎn)權代理有限公司 37256 | 代理人: | 李紅巖 |
| 地址: | 200030 上海市徐匯區(qū)*** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 圖像 表示 學習方法 系統(tǒng) | ||
1.一種圖像表示學習方法,其特征在于,包括:
增強圖像獲取步驟:獲取原始圖像的增強圖像;
特征映射獲取步驟:通過編碼器獲取所述增強圖像的特征映射;
預測步驟:使用框回歸網(wǎng)絡預測所述增強圖像的邊框,并獲取預測邊框;
計算步驟:計算真實邊框與所述預測邊框的最終損失,根據(jù)所述最終損失更新所述框回歸網(wǎng)絡及所述編碼器。
2.根據(jù)權利要求1所述的圖像表示學習方法,其特征在于,所述增強圖像獲取步驟包括,對于每個所述原始圖像,使用數(shù)據(jù)增強的方法,獲取所述原始圖像的至少兩個所述增強圖像。
3.根據(jù)權利要求1所述的圖像表示學習方法,其特征在于,所述特征映射獲取步驟包括,使用深度學習特征,提取主干網(wǎng)絡和多層感知器共同組成的所述編碼器,并根據(jù)所述編碼器獲取所述特征映射。
4.根據(jù)權利要求1所述的圖像表示學習方法,其特征在于,所述預測步驟包括,使用所述框回歸網(wǎng)絡預測每一個所述增強圖像的所述邊框,并獲取所述預測邊框。
5.根據(jù)權利要求4所述的圖像表示學習方法,其特征在于,所述計算步驟包括,使用交并比損失分別計算所述原始圖像的所述真實邊框與每一個所述增強圖像的所述預測邊框的所述損失,將至少兩個所述損失相加后獲得最終損失,根據(jù)所述最終損失反向傳播更新所述編碼器與所述框回歸網(wǎng)絡。
6.一種圖像表示學習系統(tǒng),其特征在于,適用于上述權利要求1-5所述的圖像表示學習方法,所述圖像表示學習系統(tǒng)包括:
增強圖像獲取單元:獲取原始圖像的增強圖像;
特征映射獲取單元:通過編碼器獲取所述增強圖像的特征映射;
預測單元:使用框回歸網(wǎng)絡預測所述增強圖像的邊框,獲取預測邊框;
計算單元:計算真實邊框與所述預測邊框的最終損失,根據(jù)所述最終損失更新所述框回歸網(wǎng)絡及所述編碼器。
7.根據(jù)權利要求6所述的圖像表示學習系統(tǒng),其特征在于,對于每個所述原始圖像,所述增強圖像獲取單元使用數(shù)據(jù)增強的方法,獲取所述原始圖像的至少兩個所述增強圖像。
8.根據(jù)權利要求7所述的圖像表示學習系統(tǒng),其特征在于,所述特征映射獲取單元使用深度學習特征,提取主干網(wǎng)絡和多層感知器共同組成的所述編碼器,并根據(jù)所述編碼器獲取所述特征映射。
9.根據(jù)權利要求8所述的圖像表示學習系統(tǒng),其特征在于,所述預測單元使用所述框回歸網(wǎng)絡預測每一個所述增強圖像的所述邊框后,并獲取所述預測邊框。
10.根據(jù)權利要求9所述的圖像表示學習系統(tǒng),其特征在于,所述計算單元使用交并比損失分別計算所述原始圖像的所述真實邊框與每一個所述增強圖像的所述預測邊框的所述損失,將至少兩個所述損失相加后獲得最終損失,根據(jù)所述最終損失反向傳播更新所述編碼器與所述框回歸網(wǎng)絡。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于上海明略人工智能(集團)有限公司,未經(jīng)上海明略人工智能(集團)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011632703.8/1.html,轉載請聲明來源鉆瓜專利網(wǎng)。
- 上一篇:取栓裝置
- 下一篇:一種保水緩釋肥料及其制備方法
- 彩色圖像和單色圖像的圖像處理
- 圖像編碼/圖像解碼方法以及圖像編碼/圖像解碼裝置
- 圖像處理裝置、圖像形成裝置、圖像讀取裝置、圖像處理方法
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序以及圖像解碼程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序、以及圖像解碼程序
- 圖像形成設備、圖像形成系統(tǒng)和圖像形成方法
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序





