[發(fā)明專利]用于對(duì)象檢測(cè)的多層聚合有效
| 申請(qǐng)?zhí)枺?/td> | 201580043139.7 | 申請(qǐng)日: | 2015-07-31 |
| 公開(公告)號(hào): | CN107155360B | 公開(公告)日: | 2019-05-07 |
| 發(fā)明(設(shè)計(jì))人: | H.阮;V.K.辛格;鄭冶楓;B.喬治斯庫(kù);D.科馬尼丘;周少華 | 申請(qǐng)(專利權(quán))人: | 西門子保健有限責(zé)任公司 |
| 主分類號(hào): | G06K9/00 | 分類號(hào): | G06K9/00;G06K9/46;G06K9/62 |
| 代理公司: | 中國(guó)專利代理(香港)有限公司 72001 | 代理人: | 胡莉莉;劉春元 |
| 地址: | 德國(guó)埃*** | 國(guó)省代碼: | 德國(guó);DE |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 用于 對(duì)象 檢測(cè) 多層 聚合 | ||
對(duì)象檢測(cè)(58)使用深的或多層的網(wǎng)絡(luò)(72?80)以學(xué)習(xí)用于檢測(cè)(58)圖像中的對(duì)象的特征。聚合(46)來自不同層的多個(gè)特征,以訓(xùn)練(48)用于所述對(duì)象的分類器。除了來自不同層的特征聚合之外或者作為來自不同層的特征聚合的替換,初始層(72)可以具有用于圖像(70)的不同區(qū)域的分離的所學(xué)習(xí)的節(jié)點(diǎn),以減少自由參數(shù)的數(shù)量。學(xué)習(xí)對(duì)象檢測(cè)(58)或應(yīng)用所學(xué)習(xí)的對(duì)象檢測(cè)器。
背景技術(shù)
本實(shí)施例涉及對(duì)象檢測(cè)以及對(duì)象檢測(cè)的機(jī)器學(xué)習(xí)。
對(duì)于機(jī)器學(xué)習(xí)的對(duì)象檢測(cè)而言,使用來自圖像的輸入特征以訓(xùn)練并且應(yīng)用檢測(cè)器。特征的質(zhì)量對(duì)于很多圖像分析任務(wù)的性能是關(guān)鍵的。科學(xué)家已經(jīng)利用對(duì)手頭的數(shù)據(jù)和任務(wù)的深入理解而提出了各種特征。例如,Haar特征歸因于它們的廉價(jià)計(jì)算而被使用在器官檢測(cè)和分段中。局部二元模式(LBP)特征對(duì)于表示形狀或紋理而言是良好的,并且適合于人類重新標(biāo)識(shí)。對(duì)于所有任務(wù)或所有類型的數(shù)據(jù)而言沒有特征是優(yōu)化的。通常的是要求相當(dāng)大量的經(jīng)驗(yàn)以針對(duì)特定的應(yīng)用選擇良好的特征。
感測(cè)技術(shù)的演進(jìn)或者現(xiàn)有的感測(cè)技術(shù)上的變化偶爾使新的特征的設(shè)計(jì)成為必須。該處理通常是有挑戰(zhàn)性的,因?yàn)閿?shù)據(jù)生成的潛在物理學(xué)可能不容易理解。字典學(xué)習(xí)和稀疏編碼算法已經(jīng)被用于學(xué)習(xí)特征。例如,字典學(xué)習(xí)和稀疏編碼算法當(dāng)被應(yīng)用于自然圖像時(shí)學(xué)習(xí)類似Gabor的模式。然而,歸因于字典原子的高相干性,該方法可能產(chǎn)生不穩(wěn)定的特征。換言之,如果存在看起來相似的多個(gè)字典原子,則稀疏碼可能在任何的這些原子之間跳轉(zhuǎn)。雖然這對(duì)于圖像重構(gòu)或圖像降噪應(yīng)用而言并不是問題,但是特征的不穩(wěn)定性對(duì)于學(xué)習(xí)良好的分類器或檢測(cè)器而言可能提出嚴(yán)重挑戰(zhàn)。
用以利用機(jī)器學(xué)習(xí)特征的另一方法使用自動(dòng)編碼器(AE)或受限制的玻爾茲曼機(jī)(RBM)。由于解碼步驟僅牽涉矩陣乘法,因此產(chǎn)生穩(wěn)定的特征。此外,AE或RBM通常是被堆棧的,以創(chuàng)建多層的深網(wǎng)絡(luò)。這種層級(jí)結(jié)構(gòu)可以在稍后的層處捕獲更抽象的特征。來自深網(wǎng)絡(luò)的最后的層的輸出被用作為所學(xué)習(xí)的特征。雖然可以使用有分辨力的訓(xùn)練來精細(xì)調(diào)諧網(wǎng)絡(luò),但是輸出可能不會(huì)捕獲所有有關(guān)的信息。這可能是由缺少所標(biāo)注的樣本或受困于不良的局部最小值的向后傳播優(yōu)化而引起的。此外,深網(wǎng)絡(luò)的完全連接的結(jié)構(gòu)使得難以在大圖像或體積的情況下進(jìn)行學(xué)習(xí)。例如,當(dāng)從100×100像素的彩色圖像學(xué)習(xí)1000個(gè)特征時(shí),網(wǎng)絡(luò)將具有大約30兆個(gè)自由參數(shù)。
發(fā)明內(nèi)容
提供了用于對(duì)象檢測(cè)的系統(tǒng)、方法以及計(jì)算機(jī)可讀介質(zhì)。所述對(duì)象檢測(cè)使用深的或多層的網(wǎng)絡(luò)以針對(duì)檢測(cè)圖像中的對(duì)象而學(xué)習(xí)特征。來自不同層的多個(gè)特征被聚合并且被用于訓(xùn)練用于對(duì)象的分類器。除了來自不同層的特征聚合以外或者作為對(duì)于來自不同層的特征聚合的替換,初始層可以具有用于圖像的不同的區(qū)域的分離的節(jié)點(diǎn),以減少自由參數(shù)的數(shù)量。學(xué)習(xí)對(duì)象檢測(cè),或者應(yīng)用所學(xué)習(xí)的對(duì)象檢測(cè)器。
在第一方面中,提供了用于對(duì)象檢測(cè)的方法。獲得對(duì)象的圖像。定義多層特征學(xué)習(xí)網(wǎng)絡(luò)的多個(gè)順序特征層。提供從網(wǎng)絡(luò)的多個(gè)層接收特征的聚合器層。處理器使用對(duì)象的圖像來聯(lián)合地優(yōu)化所述多層特征學(xué)習(xí)網(wǎng)絡(luò)和所述聚合器層。處理器輸出由被優(yōu)化的多層特征學(xué)習(xí)網(wǎng)絡(luò)表示的所學(xué)習(xí)的特征的集合以及利用通過所述聚合器層而生成的特征以檢測(cè)對(duì)象的檢測(cè)器。所學(xué)習(xí)的特征的集合用于區(qū)分所述對(duì)象,并且所述檢測(cè)器用于對(duì)所述對(duì)象進(jìn)行分類。
在第二方面中,一種非暫態(tài)計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)已經(jīng)在其中存儲(chǔ)有表示由被編程的處理器可執(zhí)行以用于對(duì)象檢測(cè)的指令的數(shù)據(jù)。所述存儲(chǔ)介質(zhì)包括用于如下的指令:接收對(duì)象的圖像;通過所述處理器檢測(cè)具有從深網(wǎng)絡(luò)的隱藏層生成的特征的圖像中的對(duì)象,隱藏特征是從所聚合的不同的抽象層學(xué)習(xí)的,并且被由機(jī)器從不同的層輸入饋送到所述隱藏特征的機(jī)器學(xué)習(xí)分類器中作為特征矢量;以及輸出對(duì)象的檢測(cè)。
在第三方面中,提供了用于對(duì)象檢測(cè)的方法。對(duì)象的圖像被劃分為局部部分。機(jī)器訓(xùn)練特征節(jié)點(diǎn)的第一塊以重構(gòu)圖像的局部部分。機(jī)器訓(xùn)練第二屬性節(jié)點(diǎn)的第二塊以重構(gòu)特征節(jié)點(diǎn)。機(jī)器還訓(xùn)練第三屬性節(jié)點(diǎn)的第三塊以重構(gòu)第二屬性節(jié)點(diǎn)。機(jī)器訓(xùn)練特征聚合器以對(duì)對(duì)象進(jìn)行分類。利用第二和第三屬性節(jié)點(diǎn)作為輸入來訓(xùn)練特征聚合器。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于西門子保健有限責(zé)任公司,未經(jīng)西門子保健有限責(zé)任公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201580043139.7/2.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06K 數(shù)據(jù)識(shí)別;數(shù)據(jù)表示;記錄載體;記錄載體的處理
G06K9-00 用于閱讀或識(shí)別印刷或書寫字符或者用于識(shí)別圖形,例如,指紋的方法或裝置
G06K9-03 .錯(cuò)誤的檢測(cè)或校正,例如,用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標(biāo)記或含有代碼標(biāo)記的打印字符的,例如,由不同形狀的各個(gè)筆畫組成的,而且每個(gè)筆畫表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理,即無須判定關(guān)于圖像的同一性而進(jìn)行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合
- 對(duì)象選擇裝置、對(duì)象選擇程序及對(duì)象選擇方法
- 對(duì)象顯示裝置、對(duì)象顯示系統(tǒng)以及對(duì)象顯示方法
- 對(duì)象顯示裝置、對(duì)象顯示方法和對(duì)象顯示程序
- 對(duì)象顯示裝置、對(duì)象顯示方法和對(duì)象顯示程序
- 對(duì)象顯示裝置、對(duì)象顯示方法和對(duì)象顯示程序
- 對(duì)象分析方法、對(duì)象分析設(shè)備及對(duì)象分析系統(tǒng)
- 對(duì)象索引方法、對(duì)象搜索方法及對(duì)象索引系統(tǒng)
- 對(duì)象分類方法和對(duì)象分類設(shè)備
- 對(duì)象庫(kù)中的對(duì)象簽名
- 對(duì)象追蹤方法、對(duì)象追蹤系統(tǒng)以及對(duì)象追蹤程序
- 檢測(cè)裝置、檢測(cè)方法和檢測(cè)組件
- 檢測(cè)方法、檢測(cè)裝置和檢測(cè)系統(tǒng)
- 檢測(cè)裝置、檢測(cè)方法以及記錄介質(zhì)
- 檢測(cè)設(shè)備、檢測(cè)系統(tǒng)和檢測(cè)方法
- 檢測(cè)芯片、檢測(cè)設(shè)備、檢測(cè)系統(tǒng)和檢測(cè)方法
- 檢測(cè)裝置、檢測(cè)設(shè)備及檢測(cè)方法
- 檢測(cè)芯片、檢測(cè)設(shè)備、檢測(cè)系統(tǒng)
- 檢測(cè)組件、檢測(cè)裝置以及檢測(cè)系統(tǒng)
- 檢測(cè)裝置、檢測(cè)方法及檢測(cè)程序
- 檢測(cè)電路、檢測(cè)裝置及檢測(cè)系統(tǒng)





