[發明專利]用于生成圖像描述矢量的方法和設備、圖像檢測方法和設備有效
| 申請號: | 201210044156.0 | 申請日: | 2012-02-24 |
| 公開(公告)號: | CN103294685A | 公開(公告)日: | 2013-09-11 |
| 發明(設計)人: | 姜涌;張文文;胥立豐 | 申請(專利權)人: | 佳能株式會社 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 中國國際貿易促進委員會專利商標事務所 11038 | 代理人: | 魏小薇 |
| 地址: | 日本*** | 國省代碼: | 日本;JP |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 用于 生成 圖像 描述 矢量 方法 設備 檢測 | ||
技術領域
本發明涉及用于生成圖像描述矢量的方法和設備,以及圖像檢測方法和圖像檢測設備。
背景技術
在近幾十年中,對于特定對象或目標(諸如人、面部、車輛等)的檢測技術已取得了很大進步。為了描述圖像的形態(morphology),可以從圖像中提取判別性的特征或模式(pattern),以形成圖像描述符(圖像描述矢量)。在一些技術中,利用大量樣本的訓練過程是必要的。而對于更一般的或無需訓練的對象檢測,有效且強健的特征描述符(描述符矢量)是非常重要的。
近年來,作為用于描述圖像的微結構的強有力的不因灰度而改變的(grey-scale?invariant)局部紋理描述符,提出了局部二進制模式(LBP)描述符和局部三進制模式(LTP)描述符(例如請參見T.Ojala、M.Pietikainen和T.Maenpaa的“Multi-resolution?Gray-Scale?and?Rotation?Invariant?Texture?Classification?with?Local?Binary?Patterns”,IEEE?Transaction?on?pattern?analysis?and?machine?intelligence,24(7),2002以及Xiaoyang?Tan和Bill?Triggs的“Enhanced?Local?Texture?Feature?Sets?for?Face?Recognition?Under?Difficult?Lighting?Conditions”,IEEE?Transactions?on?Image?Processing,PP.1635-1650,19(6),2010)。這兩種模式(圖像描述符)被廣泛用于面部識別領域,并且取得了很大成功。
現在將參照圖1和圖2簡短地描述LBP描述符和LTP描述符。
圖1是示出LBP描述符的原理的示意圖。
如圖1所示,LBP方法將圖像中的每個像素編碼成一個8位二進制碼。更具體地,對于3×3的像素矩陣,如果相鄰像素的像素值大于或等于中心像素的像素值,則8位二進制碼中的表示該相鄰像素的位被設為“1”,而如果相鄰像素的像素值小于中心像素的像素值,則8位二進制碼中的表示該相鄰像素的位被設為“0”。以這種方式,通過相對于中心像素的像素值對八個相鄰像素進行閾值判斷,形成對于該中心像素的8位二進制碼。在圖1中,白色點表示二進制位“1”且黑色點表示二進制位“0”。LBP特征可描述被編碼的像素(中心像素)周圍的紋理結構。
然而,單個閾值和兩像素比較使得LBP方法對于噪聲非常敏感,且可靠性在強烈照明下將顯著降低。此外,該編碼方案將LBP特征限制為僅呈現小的紋理結構集合,如較亮或較暗的邊緣和點。進一步地,由LBP特征代表的結構僅捕捉像素的周圍特征,而該像素本身的特征被丟失。
圖2是示出LTP描述符的原理的示意圖。
如圖2所示,LTP方法將圖像中的每個像素編碼為8位三進制碼。更具體地說,對于3×3的像素矩陣,如果相鄰像素的像素值大于上限閾值,則8位三進制碼中的表示該相鄰像素的位被設為“1”,如果相鄰像素的像素值不大于該上限閾值且不小于下限閾值,則8位三進制碼中的表示該相鄰像素的位被設為“0”,而如果相鄰像素的像素值小于該下限閾值,則8位三進制碼中的表示該相鄰像素的位被設為“-1”。上限閾值可被設為(中心像素值+T),而下限閾值可被設為(中心像素值-T),其中T是可按照適當方式設定的恒定裕量。以這種方式,通過相對于中心像素的像素值對八個相鄰像素進行雙重閾值判斷,形成對于該中心像素的8位三進制碼。在圖2中,白色點表示三進制位“1”,黑色點表示三進制位“-1”,且灰色點表示三進制位“0”。
通過使用雙重閾值判斷,與LBP特征相比,LTP特征能以提高的強健性描述被編碼的像素(中心像素)周圍的紋理結構,并且可保留更加詳細的圖像結構。
發明內容
LTP特征可表示圖像及其周圍的38=6561種模式(結構),這遠多于LBP特征所能呈現的28=256種模式。然而,本發明的發明人發現,這6561種LTP模式中的許多表示不希望的結構(例如,噪聲模式的結構)。要存儲和使用的太多模式導致描述圖像時的低效率。也就是說,雖然LTP方法能夠比LBP方法更精細地且以更強的強健性描述圖像,效率卻顯著下降。
因此,需要一種用于生成圖像描述矢量的新方法,該圖像描述矢量能夠精細地同時有效率地描述圖像。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于佳能株式會社,未經佳能株式會社許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201210044156.0/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:基于公交系統的路徑規劃方法及裝置
- 下一篇:一種防近視字體的處理方法
- 彩色圖像和單色圖像的圖像處理
- 圖像編碼/圖像解碼方法以及圖像編碼/圖像解碼裝置
- 圖像處理裝置、圖像形成裝置、圖像讀取裝置、圖像處理方法
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序以及圖像解碼程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序、以及圖像解碼程序
- 圖像形成設備、圖像形成系統和圖像形成方法
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序





