[發(fā)明專利]圖像或圖像序列中的對象識別在審

申請?zhí)枺?/td>	201310085007.3	申請日：	2013-03-18
公開（公告）號：	CN103310189A	公開（公告）日：	2013-09-18
發(fā)明（設計）人：	M.溫特;W.普特茲克-羅明;J.賈查爾斯基	申請（專利權）人：	湯姆遜許可公司
主分類號：	G06K9/00	分類號：	G06K9/00;G06F17/30
代理公司：	北京市柳沈律師事務所 11105	代理人：	呂曉章
地址：	法國伊西***	國省代碼：	法國;FR
權利要求書：	查看更多	說明書：	查看更多
摘要：
搜索關鍵詞：	圖像序列中的對象識別
鉆瓜網(wǎng) 技術展會專利詞庫專利權人專利榜在售專利公布日期熱門專利

【說明書】：

技術領域

本發(fā)明涉及一種在圖像或者圖像序列中識別對象的方法和裝置。本發(fā)明尤其涉及一種利用超級像素在圖像或者圖像序列中識別對象的方法和裝置。

背景技術

存在識別2D或3D視頻序列或者單個圖像中的對象的若干途徑。例如，面部辨認是小型相機的技術發(fā)展水平，即它已經(jīng)實現(xiàn)為低性能CPU的實時應用。然而，所有這些算法通常專用于特定應用。更多的一般途徑通常需要非常復雜的算法以及增強的處理能力。

發(fā)明內容

因此本發(fā)明的目的是提出一種在圖像或圖像序列中識別對象的簡化并且要求更低的解決方案。

根據(jù)本發(fā)明，通過一種在圖像或者圖像序列中識別對象的方法實現(xiàn)此目的，該方法包括以下步驟：

-分割第一圖像為若干超級像素；

-確定成組的超級像素集合；

-發(fā)送成組的超級像素集合到搜索引擎；以及

-接收搜索引擎對成組的超級像素集合執(zhí)行的搜索結果。

類似地，一種用于識別圖像或者圖像序列中的對象的裝置包括：

-分割器，用于分割第一圖像為若干超級像素；

-分析器或者用戶界面，用于確定成組的超級像素集合；以及

-接口，用于發(fā)送成組的超級像素集合到搜索引擎并且用于接收搜索引擎對成組的超級像素集合執(zhí)行的搜索的結果。

本發(fā)明的解決方案組合兩種不同途徑以識別2D或者3D或者多視圖圖像序列或者單個圖像中的對象。首先，該一個或者多個圖像被分割為若干超級像素。然后要么用戶標記將被進一步研究的那些超級像素，要么自動檢測屬于一個對象的成組的超級像素集合。自動檢測基于例如圖像序列情形中的超級像素時間分析、立體或者多視圖圖像集合中的兩個或者更多圖像的空間分析或者其他圖像分析過程。在任何情形中，一旦已知要識別的超級像素集合，就構建該超級像素集合的特性列表。這些特性作為查詢被發(fā)送給特定超級像素對象數(shù)據(jù)庫，它確定與這些特性對應的最合適的對象。然后將所識別的對象類型發(fā)送回用戶。本發(fā)明利用大多數(shù)對象都具有一個超級像素的特性集合的發(fā)現(xiàn)。因此基于超級像素識別圖像或者圖像序列中的對象是可能的。隨著數(shù)據(jù)庫持續(xù)不斷地增大并且包羅萬象，不斷增強的搜索引擎能力使得供機頂盒、智能手機、類似平板設備使用的方便的對象搜索工具成為可能。

有利地，附加信息被發(fā)送到超級像素對象數(shù)據(jù)庫，例如關于包含要識別的對象的圖像或者圖像序列的元數(shù)據(jù)。這樣的元數(shù)據(jù)的實例是電影字幕、電影中的演員列表等。這些附加元數(shù)據(jù)幫助穩(wěn)定分類，因為它們將在某種程度上排除不正確的分類。此外，觀察的對象的時間運動可以被分析并且發(fā)送到數(shù)據(jù)庫以改進搜索結果。

附圖說明

為了更好地理解，現(xiàn)在將參考附圖在下面的描述中更詳細地解釋本發(fā)明。應該理解的是，本發(fā)明不限于該示例性實施例并且也可以在不脫離所附權利要求限定的本發(fā)明的范圍的情況下有利地組合和/或修改特定特征。在附圖中：

圖1描繪原始圖像；

圖2示出圖1的圖像的人工標記分割；

圖3描繪從圖1的圖像中導出的超級像素；

圖4示出使用圖3的超級像素的圖2的人工標記分割的重構。

圖5描繪具有用戶標記的多個超級像素的斑馬的圖像；

圖6示出放大的具有用戶標記的超級像素的圖5的一部分；

圖7示出分割成若干超級像素的魚的圖像；

圖8示出分割成若干超級像素的建筑的圖像；

圖9示意性圖示根據(jù)本發(fā)明的對象識別的方法；以及

圖10示意性描繪根據(jù)本發(fā)明的對象識別的裝置。

具體實施方式

生成超級像素或者更確切地說生成超級像素圖（superpixel?maps）以及將它們用于對象辨認目前正被考慮用于圖像處理。例如，X.Ren等的論文“Learning?a?Classification?Model?for?Segmentation”,9th?IEEE?International?Conference?on?Computer?Vision(ICCV2003),pp.10-17,描述將圖像過分割（oversegmentation）成若干超級像素以降低圖像的復雜性。

下載完整專利技術內容需要扣除積分，VIP會員可以免費下載。

免登錄下載普通用戶下載升級VIP會員，免費下載

該專利技術資料僅供研究查看技術是否侵權等信息，商用須獲得專利權人授權。該專利全部權利屬于湯姆遜許可公司，未經(jīng)湯姆遜許可公司許可，擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作，請聯(lián)系【客服】

本文鏈接：http://www.szxzyx.cn/pat/books/201310085007.3/2.html，轉載請聲明來源鉆瓜專利網(wǎng)。