[發(fā)明專利]信息處理設備和方法、程序以及記錄介質無效
| 申請?zhí)枺?/td> | 200910179416.3 | 申請日: | 2009-10-09 |
| 公開(公告)號: | CN101714212A | 公開(公告)日: | 2010-05-26 |
| 發(fā)明(設計)人: | 佐部浩太郎 | 申請(專利權)人: | 索尼株式會社 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62;G06K9/00 |
| 代理公司: | 北京東方億思知識產(chǎn)權代理有限責任公司 11258 | 代理人: | 宋鶴;南霆 |
| 地址: | 日本*** | 國省代碼: | 日本;JP |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 信息處理 設備 方法 程序 以及 記錄 介質 | ||
技術領域
本發(fā)明涉及信息處理設備和方法、程序以及記錄介質,并且更具體而言,涉及使得能夠根據(jù)圖像的場景對圖像進行分類的信息處理設備和方法、程序以及記錄介質。
背景技術
近年來,數(shù)字相機等已被廣泛使用,并且用戶擁有更多機會來處理圖像。例如,利用數(shù)字相機等捕獲的圖像數(shù)目增加。因此,用戶希望根據(jù)某些條件對所捕獲的圖像進行分類和管理。大多數(shù)捕獲圖像是包括人的臉部的圖像??紤]這些東西,例如,已經(jīng)提出了根據(jù)圖像是否是肖像圖片來對圖像進行分類,并且當圖像是肖像圖片時,對圖像中的臉部進行判別和分類。為了實現(xiàn)以上所述,有必要對人的臉部和臉部的方向進行判別(例如,見日本未審查專利申請?zhí)亻_2005-284487和2005-157679)。
發(fā)明內容
已經(jīng)針對對所捕獲的圖像的場景進行進一步判別進行了研究。在這些研究中,許多高度熟練的技術使用在圖像中出現(xiàn)的局部特征樣式的外觀的頻率,例如顏色或邊緣。對外觀的頻率進行向量化,并且采用向量化的特征空間。在該特征空間中,基于執(zhí)行哪種判別,統(tǒng)計地學習具有給定場景的標簽的關系來獲得標識器。
利用這樣的技術,可以粗略地判別與整個外觀明顯不同的場景,例如風景、都市、人和食物。然而,很難在理解場景的含義之后判別場景,例如某一圖像與旅行場景和集體合影場景相對應。
某些統(tǒng)計數(shù)據(jù)顯示70%的捕獲圖像是肖像圖片。因此,當用戶為了圖像搜索的目的希望對圖像進行分類時,僅根據(jù)它們是否是消息圖片來對圖像進行簡單分類是不夠的。為了完全地滿足該目的,有必要根據(jù)某些條件來對肖像圖片進行進一步的分類。
本發(fā)明提供了用于在理解圖像場景的情況下判別圖像的場景的技術。
根據(jù)本發(fā)明實施例,提供了一種信息處理設備,包括以下元件:用于在圖像中檢測臉部的臉部檢測裝置;用于判別由所述臉部檢測裝置檢測出的臉部的屬性的判別裝置;用于從由所述臉部檢測裝置檢測出的臉部和由所述判別裝置判別出的屬性中生成所述圖像的特征量的生成裝置;以及用于從由所述生成裝置生成的特征量中學習用于判別所述圖像是否與預定場景相對應的信息的學習裝置。
該臉部檢測裝置可以檢測至少圖像中的臉部的位置、大小和方向以及圖像中的臉部的數(shù)目,并且該生成裝置通過將臉部的位置和大小轉換成獨立于圖像的大小的值來生成特征量。
所述屬性可以是以下內容中的至少一個:面部表情、性別、年齡、種族、眼睛是否閉著、是否佩戴眼鏡、眼睛是否朝著相機以及光照是否均勻。
所述生成裝置可以生成所述特征量作為總共M×N維的向量,該向量對于所述圖像中所包括的M個臉部的每個臉部具有N維信息。
所述學習裝置可以通過執(zhí)行助推來執(zhí)行學習。
可以基于通過所述學習裝置所執(zhí)行的學習而獲得的信息來判別用作處理目標的圖像的場景。
根據(jù)本發(fā)明另一實施例,提供了一種信息處理方法,包括以下步驟:在圖像中檢測臉部;判別所檢測出的臉部的屬性;從所檢測出的臉部和所判別出的屬性中生成所述圖像的特征量;以及從所生成的特征量中學習用于判別所述圖像是否與預定場景相對應的信息。
根據(jù)本發(fā)明另一實施例,提供一種用于執(zhí)行處理的計算機可讀程序,該處理包括以下步驟:在圖像中檢測臉部;判別所檢測出的臉部的屬性;
從所檢測出的臉部和所判別出的屬性中生成所述圖像的特征量;以及
從所生成的特征量中學習用于判別所述圖像是否與預定場景相對應的信息。
根據(jù)本發(fā)明另一實施例,提供了一種記錄介質,其上記錄了以上所述的程序。
在根據(jù)本發(fā)明實施例的信息處理設備和方法以及程序中,臉部在圖像中被檢測出;臉部的屬性被判別;圖像的特征量被從所檢測到的臉部和所判別出的屬性中生成;并且用于判別圖像是否與預定場景相對應的信息被學習。
根據(jù)本發(fā)明實施例,可以在理解圖像的場景的情況下,判別圖像的場景。
附圖說明
圖1是圖示出根據(jù)本發(fā)明一個實施例的學習裝置的結構的示圖;
圖2是描述學習的流程圖;
圖3是描述臉部檢測的示圖;
圖4包括作為臉部檢測的結果而獲得的信息的示圖;
圖5是描述局部檢測的示圖;
圖6包括描述作為局部檢測的結果而獲得的信息的示圖;
圖7包括描述屬性的示圖;
圖8是描述特征量的示圖;
圖9是描述與學習相關的處理的流程圖;
圖10A至圖10F是描述場景的示圖;
圖11是圖示出根據(jù)本發(fā)明的一個實施例的分類裝置的結構的示圖;
圖12是描述分類處理的流程圖;以及
圖13是描述記錄介質的示圖。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于索尼株式會社,未經(jīng)索尼株式會社許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/200910179416.3/2.html,轉載請聲明來源鉆瓜專利網(wǎng)。





