[發(fā)明專利]一種自下而上-自上而下的行為識(shí)別系統(tǒng)在審
| 申請(qǐng)?zhí)枺?/td> | 201910064508.0 | 申請(qǐng)日: | 2019-01-23 |
| 公開(公告)號(hào): | CN109858419A | 公開(公告)日: | 2019-06-07 |
| 發(fā)明(設(shè)計(jì))人: | 招繼恩;朱勇杰;王國(guó)良;張海;譚大倫;周明 | 申請(qǐng)(專利權(quán))人: | 廣州智慧城市發(fā)展研究院;中山大學(xué) |
| 主分類號(hào): | G06K9/00 | 分類號(hào): | G06K9/00;G06N3/04 |
| 代理公司: | 廣州專理知識(shí)產(chǎn)權(quán)代理事務(wù)所(普通合伙) 44493 | 代理人: | 譚昉 |
| 地址: | 510000 廣東省廣州*** | 國(guó)省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 行為識(shí)別系統(tǒng) 局部特征 聚焦位置 空間網(wǎng)格 前饋方式 區(qū)域捕獲 全局信息 位置對(duì)象 信息功能 敏感度 長(zhǎng)程 統(tǒng)計(jì) 圖像 場(chǎng)景 | ||
1.一種自下而上-自上而下的行為識(shí)別系統(tǒng),其特征在于,包括SBTA模塊和STBTA模塊;所述SBTA模塊和STBTA模塊通過自下而上自上而下機(jī)制和注意機(jī)制對(duì)局部特征和全局信息進(jìn)行編碼;
自下而上自上而下機(jī)制為對(duì)特征圖進(jìn)行逐層下采樣后逐層上采樣,通過殘差聯(lián)接保留多尺度學(xué)習(xí),并具有科學(xué)系參數(shù)。
2.根據(jù)權(quán)利要求1所述的自下而上-自上而下的行為識(shí)別系統(tǒng),其特征在于,所述系統(tǒng)最大池化層用于將特征處理到非常低的分辨率;任何相鄰層之間均存在殘差連接模塊,在此模塊中首先對(duì)輸入功能進(jìn)行三次下采樣,在達(dá)到最低分辨率后,網(wǎng)絡(luò)開始按比例進(jìn)行雙線性上采樣并對(duì)相應(yīng)特征進(jìn)行組合;此外,增加了空間和時(shí)間注意力模塊,以強(qiáng)調(diào)關(guān)鍵局部區(qū)域的功能,進(jìn)一步提高網(wǎng)絡(luò)性能;整個(gè)模塊類似與一個(gè)沙漏的設(shè)計(jì),并且兩端是相互對(duì)稱的;整個(gè)模塊的輸出對(duì)于不同通道、不同空間位置點(diǎn)都賦予了不同權(quán)重。
3.根據(jù)權(quán)利要求1所述的自下而上-自上而下的行為識(shí)別系統(tǒng),其特征在于,所述系統(tǒng)首先通過1x1的卷積核進(jìn)行通道壓縮,而后使用3x3的卷積核來適用高級(jí)信息,最后通過1x1的卷積核使得通道還原至,在這里使用殘差連接來保留原始信息,用來減輕過擬合和避免梯度彌散;使用1x1卷積有縮減開銷的價(jià)值,以及使用連續(xù)較小的過濾器捕獲較大空間上下文;能用兩個(gè)獨(dú)立的3x3濾波器替換一個(gè)5x5濾波器,根據(jù)這些見解在不同的層模塊中進(jìn)行交換;不使用大于3x3的過濾器,限制了每個(gè)層的參數(shù)總數(shù)。
4.根據(jù)權(quán)利要求1所述的自下而上-自上而下的行為識(shí)別系統(tǒng),其特征在于,所述系統(tǒng)STBTA需要考慮空間和時(shí)間維度的關(guān)系; 經(jīng)過兩次下采樣后,使用自注意力模塊來捕獲遠(yuǎn)程依賴; 然后對(duì)這些功能進(jìn)行采樣并進(jìn)行聚合,將3D通道注意力放在模塊的最后; 在此模塊中,所有過濾器和池化方式都是3D;以與2D不同的方式設(shè)計(jì)3D自下而上-自上而下模塊;該模塊有兩個(gè)分支,上部分分支使用2D最大池化和2D平均池化,將它們逐元素相加在一起之后,使用2層MLP和Sigmoid激活函數(shù)來獲得0-1之間的權(quán)值分布;下部分分支使用3D最大池和3D平均池,在使用逐元素相加將它們加在一起之后,使用2層MLP和sigmoid激活函數(shù)來獲得權(quán)重分布;然后將這些分支添加到一起進(jìn)行耦合并得到輸出特征,輸入到神經(jīng)網(wǎng)絡(luò)的下一層;
模塊結(jié)果輸出直接作為下一層模塊的輸入,該模塊生成另一組預(yù)測(cè);在最終的網(wǎng)絡(luò)設(shè)計(jì)中,使用了8個(gè)STBA模塊。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于廣州智慧城市發(fā)展研究院;中山大學(xué),未經(jīng)廣州智慧城市發(fā)展研究院;中山大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910064508.0/1.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06K 數(shù)據(jù)識(shí)別;數(shù)據(jù)表示;記錄載體;記錄載體的處理
G06K9-00 用于閱讀或識(shí)別印刷或書寫字符或者用于識(shí)別圖形,例如,指紋的方法或裝置
G06K9-03 .錯(cuò)誤的檢測(cè)或校正,例如,用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標(biāo)記或含有代碼標(biāo)記的打印字符的,例如,由不同形狀的各個(gè)筆畫組成的,而且每個(gè)筆畫表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理,即無須判定關(guān)于圖像的同一性而進(jìn)行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合
- 一種考場(chǎng)智能監(jiān)控系統(tǒng)和方法
- 一種學(xué)生行為識(shí)別管理系統(tǒng)
- 針對(duì)網(wǎng)站的行為識(shí)別方法、裝置、設(shè)備及可讀存儲(chǔ)介質(zhì)
- 基于人工智能圖像處理算法的化工廠人員安全保障系統(tǒng)及預(yù)警方法
- 一種危險(xiǎn)行為動(dòng)作識(shí)別系統(tǒng)
- 一種工程項(xiàng)目作業(yè)的定場(chǎng)景監(jiān)控系統(tǒng)
- 一種基于兒童玩具的智能控制系統(tǒng)及裝置
- 基于人工智能技術(shù)的網(wǎng)課在線學(xué)生學(xué)習(xí)行為識(shí)別系統(tǒng)
- 一種用于圍標(biāo)串標(biāo)的智能識(shí)別系統(tǒng)
- 井場(chǎng)智能視頻監(jiān)控系統(tǒng)
- 調(diào)整聚焦位置的方法
- 光盤裝置、聚焦位置控制方法和聚焦位置控制裝置
- 分離光的方法和單元、光學(xué)拾取裝置及光學(xué)記錄/重現(xiàn)設(shè)備
- 一種自動(dòng)聚焦控制的方法及其裝置
- 用以校正光學(xué)模塊的聚焦位置的電路及其校正方法
- 自動(dòng)聚焦方法、記錄該方法的記錄介質(zhì)以及自動(dòng)聚焦設(shè)備
- 位置標(biāo)簽相機(jī)聚焦系統(tǒng)
- 聚焦位置檢測(cè)裝置和聚焦位置檢測(cè)方法
- 聚焦鏡可調(diào)激光切割頭和激光切割機(jī)
- 樣本圖像擬合聚焦的方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)
- 一種空間點(diǎn)數(shù)據(jù)的處理方法及裝置
- 一種基于網(wǎng)格劃分的并行空間劃分方法及其系統(tǒng)
- 空間目標(biāo)索引構(gòu)建、碰撞預(yù)警、區(qū)域和最近鄰查詢方法
- 一種建立空間網(wǎng)格體系的方法、裝置及遙感影像處理系統(tǒng)
- 網(wǎng)格數(shù)據(jù)處理方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)
- 一種網(wǎng)格空間的數(shù)據(jù)檢索方法
- 數(shù)字孿生城市多尺度空間網(wǎng)格編碼方法及裝置
- 預(yù)應(yīng)力空間網(wǎng)格結(jié)構(gòu)
- 一種基于GeoSOT網(wǎng)格的電網(wǎng)巡檢空間網(wǎng)格編碼方法
- 一種基于空間網(wǎng)格的行業(yè)地址序號(hào)生成方法及裝置





