[發(fā)明專利]用于對象識別和檢測的多尺度特征表示有效
| 申請?zhí)枺?/td> | 201910561512.8 | 申請日: | 2019-06-26 |
| 公開(公告)號: | CN110647793B | 公開(公告)日: | 2023-06-06 |
| 發(fā)明(設(shè)計(jì))人: | 范權(quán)福;陳均富 | 申請(專利權(quán))人: | 國際商業(yè)機(jī)器公司 |
| 主分類號: | G06V10/82 | 分類號: | G06V10/82;G06N3/0464 |
| 代理公司: | 北京市中咨律師事務(wù)所 11247 | 代理人: | 李永敏;于靜 |
| 地址: | 美國*** | 國省代碼: | 暫無信息 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 用于 對象 識別 檢測 尺度 特征 表示 | ||
1.一種用于圖像數(shù)據(jù)的多尺度表示的計(jì)算機(jī)實(shí)現(xiàn)的方法,包括:
由處理器接收原始輸入;
由所述處理器將所述原始輸入以預(yù)定因子下采樣成縮減輸入,所述下采樣輸入包括相比所述原始輸入的更低分辨率;
將包括所述更低分辨率的所述縮減輸入輸入到第一卷積神經(jīng)網(wǎng)絡(luò)CNN;
由所述處理器在所述縮減輸入上運(yùn)行所述第一CNN并且以所述預(yù)定因子上采樣,從而產(chǎn)生第一輸出;
將包括相比所述縮減輸入的更高分辨率的所述原始輸入輸入到第二CNN;
由所述處理器在具有所述更高分辨率的所述原始輸入上運(yùn)行所述第二CNN從而產(chǎn)生第二輸出,在所述更高分辨率上沒有縮減所述原始輸入,其中,所述第一CNN包括B數(shù)量的層并且所述第二CNN包括B除以β的數(shù)量的層,其中β的范圍為2至4,其中所述第一CNN被配置為獲取特征表示并且所述第二CNN被配置為更強(qiáng)的特征表示;
由所述處理器將所述第一CNN的所述第一輸出與所述第二CNN的所述第二輸出相合并;以及
由所述處理器在所述第一輸出和所述第二輸出的所述合并之后提供結(jié)果,其中所述第一CNN與第一尺度相關(guān)并且所述第二CNN與第二尺度相關(guān),其中,在訓(xùn)練期間所述第二CNN的分支與所述第二CNN合并使得所述第一CNN從所述第二CNN的所述第二尺度學(xué)習(xí)并且所述第二CNN從所述第一CNN的所述第一尺度學(xué)習(xí),從而允許所述第一CNN和所述第二CNN學(xué)習(xí)所述第一尺度和所述第二尺度之間的差異。
2.根據(jù)權(quán)利要求1所述的計(jì)算機(jī)實(shí)現(xiàn)的方法,其中,所述原始輸入包括表示圖像的圖像數(shù)據(jù)。
3.根據(jù)權(quán)利要求1所述的計(jì)算機(jī)實(shí)現(xiàn)的方法,進(jìn)一步包括:將所述第一CNN的所述第一輸出提供為所述第二CNN的輸入。
4.根據(jù)權(quán)利要求1所述的計(jì)算機(jī)實(shí)現(xiàn)的方法,其中,所述結(jié)果是對象的標(biāo)識。
5.根據(jù)權(quán)利要求1所述的計(jì)算機(jī)實(shí)現(xiàn)的方法,其中,所述輸入包括呈現(xiàn)音頻輸入的音頻數(shù)據(jù)。
6.根據(jù)權(quán)利要求1所述的計(jì)算機(jī)實(shí)現(xiàn)的方法,其中,所述第二CNN具有比所述第一CNN更小的特征圖。
7.一種用于圖像數(shù)據(jù)的多尺度表示的系統(tǒng),包括:
存儲器;
處理器,其通信地耦接到所述存儲器,所述處理器可操作以執(zhí)行存儲在所述存儲器中的指令,所述指令使所述處理器執(zhí)行根據(jù)權(quán)利要求1至6中任一項(xiàng)所述的方法的步驟。
8.一種計(jì)算機(jī)可讀存儲介質(zhì),其上存儲有用于圖像數(shù)據(jù)的多尺度表示的計(jì)算機(jī)程序產(chǎn)品包括程序指令,所述程序指令可由計(jì)算機(jī)執(zhí)行,以使所述計(jì)算機(jī)執(zhí)行根據(jù)權(quán)利要求1至6中任一項(xiàng)所述的方法。
9.一種用于圖像數(shù)據(jù)的多尺度表示的系統(tǒng),包括被配置為實(shí)現(xiàn)根據(jù)權(quán)利要求1至6中任一項(xiàng)所述的方法的步驟的組件。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于國際商業(yè)機(jī)器公司,未經(jīng)國際商業(yè)機(jī)器公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910561512.8/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





