[發明專利]圖像識別裝置、圖像識別方法和程序在審
| 申請號: | 201780093077.X | 申請日: | 2017-07-18 |
| 公開(公告)號: | CN110914830A | 公開(公告)日: | 2020-03-24 |
| 發明(設計)人: | 堀川勉;小野大地 | 申請(專利權)人: | 索尼互動娛樂股份有限公司 |
| 主分類號: | G06K9/00 | 分類號: | G06K9/00 |
| 代理公司: | 北京市柳沈律師事務所 11105 | 代理人: | 張曉明 |
| 地址: | 日本*** | 國省代碼: | 暫無信息 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 圖像 識別 裝置 方法 程序 | ||
提供了能夠以高精度識別多種對象的圖像識別裝置、圖像識別方法和程序。整體識別單元(58)對至少一個給定對象執行識別對象在圖像中的位置的處理。部分圖像提取單元(60)從圖像中提取部分圖像,該部分圖像是與所識別的位置相關聯的圖像的一部分。部分識別單元(64)執行識別由部分圖像表示的一個或多個對象是什么的處理,所述一個或多個對象包括其位置被識別的給定對象以外的對象。
技術領域
本發明涉及圖像識別裝置、圖像識別方法和程序。
背景技術
已知一種圖像識別技術,其基于在將要識別的圖像輸入到學習模型時獲得的輸出來識別由圖像表示的對象或圖像中表示的對象的位置。例如,對于包含在輸入圖像中的每個像素,像素的含義(諸如由像素表示的對象)由稱為語義分割的技術來指定。
發明內容
[技術問題]
當意圖由圖像識別有差別地識別多種對象時,由于與對象相關聯的各個特征量之間的差異變小,錯誤識別的可能性增加。
本發明是針對上述問題做出的,并且其目的之一是提供能夠以高精度識別多種物體的圖像識別裝置、圖像識別方法和程序。
[問題的解決方案]
為了解決上述問題,根據本發明的圖像識別裝置包括:第一識別單元,其對至少一個給定對象執行識別給定對象在圖像中的位置的處理;部分圖像提取單元,其從圖像提取部分圖像,部分圖像是與識別的位置相關聯的圖像的一部分;以及第二識別單元,其執行識別由部分圖像表示的一個或多個對象是什么的處理,一個或多個對象包括其所述位置被識別的給定對象以外的對象。
本發明的一個方面還包括:模型選擇單元,其從多個學習模型中選擇對應于其所述位置被識別的給定對象的學習模型,其中,第二識別單元通過使用選擇的學習模型來執行識別由部分圖像表示的對象是什么的處理。
此外,在本發明的一個方面,部分圖像提取單元提取占據基于與對象對應的規則、通過將圖像中表示其位置被識別的給定對象的區域移動或變形而獲得的區域的部分圖像.
在這方面,部分圖像提取占據單元提取通過將圖像中表示其位置被識別的給定對象的區域在與對象對應的方向上移動而獲得的區域的部分圖像。
可選地,部分圖像提取單元提取占據通過將圖像中表示其位置被識別的給定對象的區域放大或減小到與對象對應的尺寸而獲得的區域的部分圖像。
此外,根據本發明的圖像識別方法包括:對至少一個給定對象執行識別給定對象在圖像中的位置的處理的步驟;從圖像提取部分圖像的步驟,部分圖像是與識別的位置相關聯的圖像的一部分;以及執行識別由部分圖像表示的一個或多個對象是什么的處理的步驟,一個或多個對象包括其所述位置被識別的給定對象以外的對象。
此外,根據本發明的程序使計算機執行:對至少一個給定對象執行識別給定對象在圖像中的位置的處理的程序;從圖像提取部分圖像的程序,部分圖像是與識別的位置相關聯的圖像的一部分;以及執行識別由部分圖像表示的一個或多個對象是什么的處理的程序,一個或多個對象包括其所述位置被識別的給定對象以外的對象。
附圖說明
圖1是根據本發明實施例的圖像識別裝置的配置圖。
圖2是示出拍攝圖像的一個示例的圖。
圖3是示出深度圖像的一個示例的圖。
圖4是示出整體識別結果圖像的一個示例的圖。
圖5是示出部分識別管理數據的一個示例的圖。
圖6是示出部分拍攝圖像的一個示例的圖。
圖7是示出部分深度圖像的一個示例的圖。
圖8是示出部分識別結果圖像的一個示例的圖。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于索尼互動娛樂股份有限公司,未經索尼互動娛樂股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201780093077.X/2.html,轉載請聲明來源鉆瓜專利網。
- 彩色圖像和單色圖像的圖像處理
- 圖像編碼/圖像解碼方法以及圖像編碼/圖像解碼裝置
- 圖像處理裝置、圖像形成裝置、圖像讀取裝置、圖像處理方法
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序以及圖像解碼程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序、以及圖像解碼程序
- 圖像形成設備、圖像形成系統和圖像形成方法
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序





