[發明專利]物體識別用圖像數據庫的制作方法、處理裝置以及處理用程序無效
| 申請號: | 200980115211.7 | 申請日: | 2009-04-27 |
| 公開(公告)號: | CN102016918A | 公開(公告)日: | 2011-04-13 |
| 發明(設計)人: | 野口和人;黃瀨浩一;巖村雅一 | 申請(專利權)人: | 公立大學法人大阪府立大學 |
| 主分類號: | G06T7/00 | 分類號: | G06T7/00 |
| 代理公司: | 北京林達劉知識產權代理事務所(普通合伙) 11277 | 代理人: | 劉新宇 |
| 地址: | 日本*** | 國省代碼: | 日本;JP |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 物體 識別 圖像 數據庫 制作方法 處理 裝置 以及 程序 | ||
技術領域
本發明涉及一種物體識別用圖像數據庫的制作方法、處理裝置以及處理用程序。更詳細地說,本發明涉及如下一種圖像數據庫的制作方法、處理裝置以及處理程序:能夠從圖像所涉及的數據庫中檢索示出有與出現在作為檢索問題(Query:查詢對象)的圖像中的對象物一致的對象物的圖像。
背景技術
當使用SIFT(Scale-Invariant?Feature?Transform:尺度不變特征轉換)等局部描述符時,能夠實現對于隱藏、照明條件的變動具有魯棒性的物體識別,因此當前廣受關注(例如參照非專利文獻1、2)。識別的基礎是被稱為″Bag?of?Words″或″Bag?of?Features″的模型,不考慮局部描述符的配置、關聯(conjunction)而僅以該局部描述符的頻率為線索來識別物體。
在此,局部描述符表現了圖像的局部特征,按照規定的過程抽取局部描述符,使得對于圖像的變動(幾何轉換或照明條件、分辨率的差異)具有穩健(魯棒性)的特性。另外,局部描述符是基于圖像的局部區域而決定的,因此對于隱藏也具有魯棒性。在本說明書中也將局部描述符稱為特征矢量。這是由于該局部描述符是以矢量來表現的。
一般來說,從圖像中抽取的局部描述符的數量為數百到數千,根據情況可至數萬,因此,局部描述符的對照所需的處理時間和存儲所需的存儲器容量龐大。因而,在將識別精確度保持為固定水平的狀態下怎樣削減處理時間和存儲器容量成為了重要的研究課題。
例如,在代表性的局部描述符SIFT中,各局部描述符表現為128維的矢量。另外,已知一種通過對SIFT實施主成分分析來削減維數的PCA-SIFT。盡管如此,作為實際使用的PCA-SIFT的一例,其維數也為36維。并且,通常使用應用于一般的數值表現的32位(bit)的float型或int型作為表示各維度的數值的數據類型。在需要更高的精確度的情況下使用64位的double型。另一方面,在數值的范圍有限的情況下或即使犧牲精確度也要削減存儲器容量的情況下,也有時特別地使用16位的short?int型。即使在優先削減數據容量而特別地使用了short?int型的36維的PCA-SIFT的情況下,每個局部描述符也需要16位×36維=512位(64字節)的存儲器。
在最鄰近搜索中,通常對矢量進行距離計算來決定最鄰近的局部描述符。如果降低各維度的數據的精確度則無法進行準確的最鄰近搜索,則認為圖像識別的精確度(識別率)會降低,這在以往是公知常識。
因此,以往在很多方法中,從如下方面進行研究:將從用于制作模型的圖像中得到的局部描述符矢量量化(通過搜集類似的局部描述符并分類為規定數量的組,來將同一組的各局部描述符置換為該組的代表值進行表現的方法、聚類分析)來確定數千乃至數十萬的visual?word(相當于上述代表值)、使用該visual?word來記述圖像(例如,參照非專利文獻3)。在對未知的圖像進行識別時,將從該圖像中得到的局部描述符轉換成visual?word并對頻率等進行測量。在這種研究中,如果visual?word的數量足夠少則能夠期待高速的處理。但是,另一方面,也被指出如果visual?word的數量不多則無法達到足夠的識別率(例如,參照非專利文獻4)。如果visual?word的數量增加,則與此相應地無法忽視矢量量化所需的計算時間,并且visual?word本身的記錄也會導致在存儲器容量方面產生問題。
以上的優點/問題點在極端的情況下、即、將從用于制作模型的圖像中得到的各個局部描述符直接設為visual?word的情況下最為明顯。例如,從VGA尺寸的通常的圖像中可抽取兩千個左右的局部描述符。因而,在將VGA尺寸的10萬個圖像用于模型制作的情況下,visual?word的數量為2億,對照和存儲都需要龐大的計算資源。另一方面,通過將大量的局部描述符使用于模型,能夠實現高精確度的識別。
針對處理時間問題的解決方案之一是在局部描述符的對照中導入“近似最鄰近搜索”(例如,參照非專利文獻5和專利文獻1)。由此,例如在執行上述規模的識別任務的情況下,可知與單純的全部對照的情況相比,該解決方案能夠基本不降低識別率而使處理速度快至不足10-6。另一方面,針對存儲器容量的問題,使矢量量化稀疏是解決方案之一,但是這意味著識別率的降低,因此并非上策。
專利文獻1:國際公開第2008/026414號小冊子
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于公立大學法人大阪府立大學,未經公立大學法人大阪府立大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/200980115211.7/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:智能設備保存配置信息裝置
- 下一篇:系統初始化方法及應用其的顯示系統
- 彩色圖像和單色圖像的圖像處理
- 圖像編碼/圖像解碼方法以及圖像編碼/圖像解碼裝置
- 圖像處理裝置、圖像形成裝置、圖像讀取裝置、圖像處理方法
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序以及圖像解碼程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序、以及圖像解碼程序
- 圖像形成設備、圖像形成系統和圖像形成方法
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序





