[發明專利]用于生成圖像描述矢量的方法和設備、圖像檢測方法和設備有效

申請號：	201210044156.0	申請日：	2012-02-24
公開（公告）號：	CN103294685A	公開（公告）日：	2013-09-11
發明（設計）人：	姜涌;張文文;胥立豐	申請（專利權）人：	佳能株式會社
主分類號：	G06F17/30	分類號：	G06F17/30
代理公司：	中國國際貿易促進委員會專利商標事務所 11038	代理人：	魏小薇
地址：	日本***	國省代碼：	日本;JP
權利要求書：	查看更多	說明書：	查看更多
摘要：
搜索關鍵詞：	用于生成圖像描述矢量方法設備檢測
鉆瓜網技術展會專利詞庫專利權人專利榜在售專利公布日期熱門專利

【說明書】：

技術領域

本發明涉及用于生成圖像描述矢量的方法和設備，以及圖像檢測方法和圖像檢測設備。

背景技術

在近幾十年中，對于特定對象或目標(諸如人、面部、車輛等)的檢測技術已取得了很大進步。為了描述圖像的形態(morphology)，可以從圖像中提取判別性的特征或模式(pattern)，以形成圖像描述符(圖像描述矢量)。在一些技術中，利用大量樣本的訓練過程是必要的。而對于更一般的或無需訓練的對象檢測，有效且強健的特征描述符(描述符矢量)是非常重要的。

近年來，作為用于描述圖像的微結構的強有力的不因灰度而改變的(grey-scale?invariant)局部紋理描述符，提出了局部二進制模式(LBP)描述符和局部三進制模式(LTP)描述符(例如請參見T.Ojala、M.Pietikainen和T.Maenpaa的“Multi-resolution?Gray-Scale?and?Rotation?Invariant?Texture?Classification?with?Local?Binary?Patterns”，IEEE?Transaction?on?pattern?analysis?and?machine?intelligence，24(7)，2002以及Xiaoyang?Tan和Bill?Triggs的“Enhanced?Local?Texture?Feature?Sets?for?Face?Recognition?Under?Difficult?Lighting?Conditions”，IEEE?Transactions?on?Image?Processing，PP.1635-1650，19(6)，2010)。這兩種模式(圖像描述符)被廣泛用于面部識別領域，并且取得了很大成功。

現在將參照圖1和圖2簡短地描述LBP描述符和LTP描述符。

圖1是示出LBP描述符的原理的示意圖。

如圖1所示，LBP方法將圖像中的每個像素編碼成一個8位二進制碼。更具體地，對于3×3的像素矩陣，如果相鄰像素的像素值大于或等于中心像素的像素值，則8位二進制碼中的表示該相鄰像素的位被設為“1”，而如果相鄰像素的像素值小于中心像素的像素值，則8位二進制碼中的表示該相鄰像素的位被設為“0”。以這種方式，通過相對于中心像素的像素值對八個相鄰像素進行閾值判斷，形成對于該中心像素的8位二進制碼。在圖1中，白色點表示二進制位“1”且黑色點表示二進制位“0”。LBP特征可描述被編碼的像素(中心像素)周圍的紋理結構。

然而，單個閾值和兩像素比較使得LBP方法對于噪聲非常敏感，且可靠性在強烈照明下將顯著降低。此外，該編碼方案將LBP特征限制為僅呈現小的紋理結構集合，如較亮或較暗的邊緣和點。進一步地，由LBP特征代表的結構僅捕捉像素的周圍特征，而該像素本身的特征被丟失。

圖2是示出LTP描述符的原理的示意圖。

如圖2所示，LTP方法將圖像中的每個像素編碼為8位三進制碼。更具體地說，對于3×3的像素矩陣，如果相鄰像素的像素值大于上限閾值，則8位三進制碼中的表示該相鄰像素的位被設為“1”，如果相鄰像素的像素值不大于該上限閾值且不小于下限閾值，則8位三進制碼中的表示該相鄰像素的位被設為“0”，而如果相鄰像素的像素值小于該下限閾值，則8位三進制碼中的表示該相鄰像素的位被設為“-1”。上限閾值可被設為(中心像素值+T)，而下限閾值可被設為(中心像素值-T)，其中T是可按照適當方式設定的恒定裕量。以這種方式，通過相對于中心像素的像素值對八個相鄰像素進行雙重閾值判斷，形成對于該中心像素的8位三進制碼。在圖2中，白色點表示三進制位“1”，黑色點表示三進制位“-1”，且灰色點表示三進制位“0”。

通過使用雙重閾值判斷，與LBP特征相比，LTP特征能以提高的強健性描述被編碼的像素(中心像素)周圍的紋理結構，并且可保留更加詳細的圖像結構。

發明內容

LTP特征可表示圖像及其周圍的3⁸＝6561種模式(結構)，這遠多于LBP特征所能呈現的2⁸＝256種模式。然而，本發明的發明人發現，這6561種LTP模式中的許多表示不希望的結構(例如，噪聲模式的結構)。要存儲和使用的太多模式導致描述圖像時的低效率。也就是說，雖然LTP方法能夠比LBP方法更精細地且以更強的強健性描述圖像，效率卻顯著下降。

因此，需要一種用于生成圖像描述矢量的新方法，該圖像描述矢量能夠精細地同時有效率地描述圖像。

下載完整專利技術內容需要扣除積分，VIP會員可以免費下載。

免登錄下載普通用戶下載升級VIP會員，免費下載

該專利技術資料僅供研究查看技術是否侵權等信息，商用須獲得專利權人授權。該專利全部權利屬于佳能株式會社，未經佳能株式會社許可，擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作，請聯系【客服】

本文鏈接：http://www.szxzyx.cn/pat/books/201210044156.0/2.html，轉載請聲明來源鉆瓜專利網。