[發(fā)明專利]生成用于對(duì)象類別的區(qū)分碼字的方法和設(shè)備無效
| 申請(qǐng)?zhí)枺?/td> | 201010253750.1 | 申請(qǐng)日: | 2010-08-09 |
| 公開(公告)號(hào): | CN102375986A | 公開(公告)日: | 2012-03-14 |
| 發(fā)明(設(shè)計(jì))人: | 吳偉國;路紅;薛向陽;韋仁忠 | 申請(qǐng)(專利權(quán))人: | 索尼公司;復(fù)旦大學(xué) |
| 主分類號(hào): | G06K9/46 | 分類號(hào): | G06K9/46;G06K9/62 |
| 代理公司: | 北京集佳知識(shí)產(chǎn)權(quán)代理有限公司 11227 | 代理人: | 杜誠;陳煒 |
| 地址: | 日本*** | 國省代碼: | 日本;JP |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 生成 用于 對(duì)象 類別 區(qū)分 碼字 方法 設(shè)備 | ||
技術(shù)領(lǐng)域
本發(fā)明涉及基于局部特征的對(duì)象檢測(cè)技術(shù),更具體地,涉及生成用于對(duì)象類別的區(qū)分碼字的方法和設(shè)備。
背景技術(shù)
隨著視頻監(jiān)控、人工智能、計(jì)算機(jī)視覺等應(yīng)用的不斷普及,對(duì)檢測(cè)視頻和圖像中出現(xiàn)的特定對(duì)象,例如人、動(dòng)物、車輛等等的技術(shù)的需求日益增加。
除了例如人/非人、車輛/非車輛的單一類別的對(duì)象檢測(cè)之外,人們提出了基于局部特征的多類別對(duì)象檢測(cè)技術(shù)。例如,G.Csurka等人在“Visual?categorization?with?bags?of?keypoints”,ECCV?Workshop?on?Statistical?Learning?in?Computer?Vision,2004中提出了基于特征包(BOF,bag-of-feature)模型的技術(shù)。具體地,首先從圖像中提取局部特征點(diǎn)(例如尺度不變特征變換(SIFT)作為可視特征。接著把所提取的局部特征量化為可視碼字集,并且通過估計(jì)碼字的頻率來產(chǎn)生直方圖以表示圖像。
此外,人們還提出了從圖像或視頻中提取出包含所檢測(cè)出的對(duì)象的區(qū)域,即感興趣區(qū)域(ROI)的技術(shù)。例如,O.Chum等人在“An?examplar?model?for?learning?object?classes,”CVPR,2007中提出了用于感興趣區(qū)域檢測(cè)的示例方法。這種方法通過選擇區(qū)分碼字來學(xué)習(xí)感興趣區(qū)域模型。
發(fā)明內(nèi)容
在O.Chum等人提出的訓(xùn)練感興趣區(qū)域檢測(cè)模型的方法中,在初始化階段,針對(duì)根據(jù)訓(xùn)練圖像獲得的字典中的每個(gè)碼字wi,根據(jù)關(guān)系(1)計(jì)算每個(gè)碼字wi的區(qū)分能力D(wi)并選擇區(qū)分能力較強(qiáng)的若干碼字。
D(wi)~NWi/NIi????????(1)
其中,NWi為訓(xùn)練圖像中標(biāo)記有期望類別、包含碼字wi的圖像的數(shù)目,NIi為訓(xùn)練圖像中包含碼字wi的圖像的數(shù)目,~表示D(wi)隨著NWi/NIi的增加而增加。
此外,在改進(jìn)階段,針對(duì)前一階段標(biāo)記有期望類別的圖像中預(yù)測(cè)的感興趣區(qū)域中出現(xiàn)過的碼字,根據(jù)關(guān)系(1)計(jì)算碼字w的區(qū)分能力D(w)。
發(fā)明人認(rèn)識(shí)到,雖然在改進(jìn)階段過濾掉從未出現(xiàn)在所預(yù)測(cè)的感興趣區(qū)域中的碼字,但是對(duì)碼字的區(qū)分能力的評(píng)價(jià)未考慮到這樣的事實(shí):雖然碼字出現(xiàn)在某些訓(xùn)練圖像的感興趣區(qū)域中,然而也出現(xiàn)在更多其它訓(xùn)練圖像的感興趣區(qū)域之外。這樣的碼字更適合表征感興趣區(qū)域之外的背景區(qū)域,而不適合表征感興趣區(qū)域內(nèi)的對(duì)象,因而不適合作為區(qū)分碼字被包含在感興趣檢測(cè)模型中。
本發(fā)明的一個(gè)目的在于提供一種生成用于對(duì)象類別的區(qū)分碼字的方法和設(shè)備,其避免選擇不適于表征對(duì)象的碼字作為區(qū)分碼字。
本發(fā)明的一個(gè)實(shí)施例是一種生成用于對(duì)象類別的區(qū)分碼字的設(shè)備,包括:字典生成裝置,根據(jù)訓(xùn)練圖像集生成包含碼字的字典;碼字分布計(jì)算裝置,針對(duì)所述訓(xùn)練圖像集中的一個(gè)子集計(jì)算所述字典的每個(gè)碼字的分布,其中所述子集的每個(gè)圖像包含同一類別的對(duì)象,并且標(biāo)記有包含所述對(duì)象的感興趣區(qū)域,并且所述分布包括所述子集中在感興趣區(qū)域內(nèi)包含所述碼字的圖像的第一數(shù)目,和在感興趣區(qū)域外包含所述碼字的圖像的第二數(shù)目;和碼字選擇裝置,從所述字典的碼字中選擇所述第一數(shù)目相對(duì)較高并且所述第二數(shù)目相對(duì)較低的碼字,作為所述區(qū)分碼字。
根據(jù)上述設(shè)備的一個(gè)進(jìn)一步的實(shí)施例,碼字選擇裝置可以包括:評(píng)估值計(jì)算單元,針對(duì)所述字典中的每個(gè)碼字,獲得隨著所述第一數(shù)目與所述第二數(shù)目的差增加而增加的評(píng)估值;和選擇單元,選擇所述評(píng)估值較高的碼字作為所述區(qū)分碼字。
根據(jù)上述設(shè)備的一個(gè)進(jìn)一步的實(shí)施例,評(píng)估值還可以隨著所述第二數(shù)目的增加而降低。
根據(jù)上述設(shè)備的一個(gè)進(jìn)一步的實(shí)施例,可以通過下述方式來計(jì)算所述評(píng)估值:如果(第一數(shù)目-第二數(shù)目)為正數(shù),則評(píng)估值=(第一數(shù)目-第二數(shù)目)2/(第一數(shù)目+第二數(shù)目);如果(第一數(shù)目-第二數(shù)目)為負(fù)數(shù),則評(píng)估值=-(第一數(shù)目-第二數(shù)目)2/(第一數(shù)目+第二數(shù)目),優(yōu)選地,評(píng)估值=0。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于索尼公司;復(fù)旦大學(xué),未經(jīng)索尼公司;復(fù)旦大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201010253750.1/2.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06K 數(shù)據(jù)識(shí)別;數(shù)據(jù)表示;記錄載體;記錄載體的處理
G06K9-00 用于閱讀或識(shí)別印刷或書寫字符或者用于識(shí)別圖形,例如,指紋的方法或裝置
G06K9-03 .錯(cuò)誤的檢測(cè)或校正,例如,用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標(biāo)記或含有代碼標(biāo)記的打印字符的,例如,由不同形狀的各個(gè)筆畫組成的,而且每個(gè)筆畫表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理,即無須判定關(guān)于圖像的同一性而進(jìn)行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合
- 對(duì)象選擇裝置、對(duì)象選擇程序及對(duì)象選擇方法
- 對(duì)象顯示裝置、對(duì)象顯示系統(tǒng)以及對(duì)象顯示方法
- 對(duì)象顯示裝置、對(duì)象顯示方法和對(duì)象顯示程序
- 對(duì)象顯示裝置、對(duì)象顯示方法和對(duì)象顯示程序
- 對(duì)象顯示裝置、對(duì)象顯示方法和對(duì)象顯示程序
- 對(duì)象分析方法、對(duì)象分析設(shè)備及對(duì)象分析系統(tǒng)
- 對(duì)象索引方法、對(duì)象搜索方法及對(duì)象索引系統(tǒng)
- 對(duì)象分類方法和對(duì)象分類設(shè)備
- 對(duì)象庫中的對(duì)象簽名
- 對(duì)象追蹤方法、對(duì)象追蹤系統(tǒng)以及對(duì)象追蹤程序





