[發明專利]用于圖像辨識的描述符小塊的快速子空間投影無效
| 申請號: | 201080054401.5 | 申請日: | 2010-12-02 |
| 公開(公告)號: | CN102782708A | 公開(公告)日: | 2012-11-14 |
| 發明(設計)人: | 奧努爾·C·哈姆西奇;尤里婭·列茲尼克;約翰·H·洪;桑迪普·瓦達迪;重·U·李 | 申請(專利權)人: | 高通股份有限公司 |
| 主分類號: | G06K9/46 | 分類號: | G06K9/46 |
| 代理公司: | 北京律盟知識產權代理有限責任公司 11287 | 代理人: | 宋獻濤 |
| 地址: | 美國加利*** | 國省代碼: | 美國;US |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 用于 圖像 辨識 描述 小塊 快速 空間 投影 | ||
根據35U.S.C.§119主張優先權
本專利申請案主張2009年12月2日申請的標題為“用于圖像辨識的描述符小塊的快速子空間投影(Fast?Subspace?Projection?of?Descriptor?Patches?for?Image?Recognition)”的第61/265,950號美國臨時申請案,和2010年11月11日申請的標題為“尺度空間中的快速描述符提取(Fast?Descriptor?Extraction?in?Scale-Space)”的第61/412,759號美國臨時申請案的優先權,兩申請案均轉讓給其受讓人且特此以引用的方式明確并入本文中。
技術領域
一個特征涉及計算機視覺,且更特定來說,涉及用于改進圖像的辨識和檢索性能、處理和/或壓縮的方法和技術。
背景技術
各種應用可受益于具有能夠識別視覺表示中的目標(例如,圖像或圖片)的機器或處理器。計算機視覺的領域試圖提供準許識別圖像中的目標或特征的技術和/或算法,其中目標或特征可通過識別一個或一個以上關鍵點的描述符而表征。這些技術和/或算法常常也適用于人臉辨識、目標檢測、圖像匹配、3維結構構造、立體對應和/或運動追蹤,以及其它應用。一般來說,出于特征識別、圖像檢索和/或目標辨識的目的,目標或特征辨識可涉及識別圖像中的興趣點(也稱作關鍵點)。優選地,可選擇和/或處理關鍵點,使得其對于圖像尺度改變和/或旋轉為不變的并跨越失真的實質性范圍、視點改變和/或噪聲和照度改變提供穩健匹配(robust?matching)。另外,為了良好地適合于例如圖像檢索和目標辨識的任務,特征描述符可優選地在以下意義上有區別,單一特征可以高概率與來自多個目標圖像的特征的大數據庫正確地匹配。
在檢測和定位圖像中的關鍵點之后,可通過使用各種描述符來識別或描述所述關鍵點。舉例來說,描述符可表示圖像中的內容的視覺特征,例如,形狀、顏色、紋理、旋轉和/或運動,以及其它圖像特性。描述符可表示關鍵點和所述關鍵點周圍的局部鄰域。描述符提取的目的為獲得關鍵點周圍的局部信息的穩健、無噪聲表示。此可通過將描述符投影到無噪聲主成分分析(PCA)子空間來完成。PCA涉及正交線性變換,所述正交線性變換將數據(例如,圖像中的關鍵點)變換為新坐標系,使得通過數據的任何投影所產生的最大方差位于第一坐標(稱作第一主成分)上,第二最大方差位于第二坐標(第二主成分)上,等等。然而,到PCA子空間的這種投影需要計算上復雜的與高維投影向量的內積。
對應于關鍵點且由描述符表示的個別特征與來自已知目標的特征的數據庫匹配。因此,可將對應搜索系統分離為三個模塊:關鍵點檢測器、特征描述符和對應定位器。在這三個邏輯模塊中,描述符的構造復雜性和維數對特征匹配系統的性能具有直接和顯著影響。已提議多種描述符,其中每個描述符具有不同優點。尺度不變特征變換(SIFT)開放12σ×12σ小塊,所述小塊與鄰域中的主定向對準且經大小設計以與所檢測關鍵點σ的尺度層級成比例。此區中的梯度值在4×4單元中相加,其中每個單元中有8個頻率組定向直方圖。PCA-SIFT展示鄰域中的梯度值可以極小子空間表示。
描述符提取程序中的大多數對減少維數以消除噪聲并改進辨識準確性的優點意見一致。然而,與將描述符投影到低維子空間相關聯的大的計算復雜性妨礙了其實際使用。舉例來說,PCA-SIFT小塊大小為39×39,此導致在x方向和y方向上考慮梯度值的2*392維投影向量。因此,查詢圖像中的每個描述符針對到d維子空間的投影需要2*392*d次乘法和加法。盡管此對于大功率的服務器側機器可能不產生顯著低效率,但在具有有限處理資源的實施(例如,移動電話)中可能是瓶頸。
這些特征描述符正越來越多地發現實時目標辨識、3D重建、全景拼接、機器人映射、視頻跟蹤和類似任務中的應用。取決于應用,特征描述符(或等效物)的傳輸和/或存儲可限制目標檢測的計算速度和/或圖像數據庫的大小。在移動裝置(例如,相機電話、移動電話等)或分布式相機網絡的情況下,可在節點之間的描述符提取中花費顯著通信和處理資源。描述符提取的計算密集過程傾向于妨礙或復雜化其在資源有限裝置(例如,移動電話)上的應用。
因此,存在對快速且有效地產生局部特征描述符的方式的需要。
發明內容
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于高通股份有限公司,未經高通股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201080054401.5/2.html,轉載請聲明來源鉆瓜專利網。
- 彩色圖像和單色圖像的圖像處理
- 圖像編碼/圖像解碼方法以及圖像編碼/圖像解碼裝置
- 圖像處理裝置、圖像形成裝置、圖像讀取裝置、圖像處理方法
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序以及圖像解碼程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序、以及圖像解碼程序
- 圖像形成設備、圖像形成系統和圖像形成方法
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序





