[發(fā)明專利]基于生物大腦認(rèn)知和抉擇機(jī)理的運(yùn)動(dòng)物體識(shí)別方法及系統(tǒng)有效
| 申請(qǐng)?zhí)枺?/td> | 201810955609.2 | 申請(qǐng)日: | 2018-08-21 |
| 公開(公告)號(hào): | CN109190692B | 公開(公告)日: | 2021-11-23 |
| 發(fā)明(設(shè)計(jì))人: | 弭元元;林小涵;吳思 | 申請(qǐng)(專利權(quán))人: | 北京師范大學(xué) |
| 主分類號(hào): | G06K9/62 | 分類號(hào): | G06K9/62;G06N3/02 |
| 代理公司: | 北京汲智翼成知識(shí)產(chǎn)權(quán)代理事務(wù)所(普通合伙) 11381 | 代理人: | 陳曦;陳麗 |
| 地址: | 100875 北*** | 國(guó)省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 基于 生物 大腦 認(rèn)知 抉擇 機(jī)理 運(yùn)動(dòng) 物體 識(shí)別 方法 系統(tǒng) | ||
本發(fā)明公開了一種基于生物大腦認(rèn)知和抉擇機(jī)理的運(yùn)動(dòng)物體識(shí)別方法及其系統(tǒng)。其中,該方法包括如下步驟:S11,通過對(duì)各類運(yùn)動(dòng)物體進(jìn)行分析,得到庫網(wǎng)絡(luò)模塊到抉擇模塊的連接權(quán)重;S12,將運(yùn)動(dòng)物體的視頻按單幀輸入到庫網(wǎng)絡(luò)模塊中,將低維的輸入信號(hào)投影至高維的庫網(wǎng)絡(luò)活動(dòng)空間,獲得任意時(shí)刻庫網(wǎng)絡(luò)活動(dòng)的向量;S13,計(jì)算運(yùn)動(dòng)物體所屬各個(gè)類別的證據(jù)強(qiáng)度;S14,將證據(jù)強(qiáng)度輸入抉擇模塊,抉擇模塊的各個(gè)抉擇神經(jīng)元根據(jù)輸入的各個(gè)類別的證據(jù)強(qiáng)度進(jìn)行積累,重復(fù)S12~S13,視頻輸入完成后,選擇累積的證據(jù)強(qiáng)度超過抉擇閾值的抉擇神經(jīng)元,得到運(yùn)動(dòng)物體所屬的類別。該方法引入網(wǎng)絡(luò)動(dòng)力學(xué)使得抉擇模塊能夠持續(xù)整合時(shí)間和空間上的信息,提高運(yùn)動(dòng)物體識(shí)別的準(zhǔn)確性。
技術(shù)領(lǐng)域
本發(fā)明涉及一種運(yùn)動(dòng)物體識(shí)別方法,尤其涉及一種基于生物大腦認(rèn)知和抉擇機(jī)理的運(yùn)動(dòng)物體識(shí)別方法,同時(shí)涉及相應(yīng)的運(yùn)動(dòng)物體識(shí)別系統(tǒng),屬于運(yùn)動(dòng)物體識(shí)別技術(shù)領(lǐng)域。
背景技術(shù)
物體識(shí)別一直是人工智能的研究熱點(diǎn),是眾多人工智能應(yīng)用的理論基礎(chǔ),其成果在社會(huì)的諸多領(lǐng)域,如圖像分析、智能監(jiān)控、無人駕駛等,都具有重要的應(yīng)用價(jià)值。近年來,簡(jiǎn)單模仿視覺通路等級(jí)結(jié)構(gòu)的人工神經(jīng)網(wǎng)絡(luò)算法-“深度學(xué)習(xí)”,已經(jīng)在靜止、規(guī)范化的圖像識(shí)別上取得了巨大成功,甚至在超大數(shù)據(jù)集上的準(zhǔn)確率達(dá)到或者超過人類。
但到目前為止,人工智能最優(yōu)算法在運(yùn)動(dòng)物體識(shí)別方面的表現(xiàn)還差強(qiáng)人意,遠(yuǎn)遠(yuǎn)落后于人類。究其原因,這是因?yàn)楫?dāng)前的深度神經(jīng)網(wǎng)絡(luò)缺乏對(duì)時(shí)間域信息進(jìn)行有效處理的機(jī)制。雖然目前存在RNN(recurrent neural network,即互饋神經(jīng)網(wǎng)絡(luò))以及各種拓展的模型,但是這些模型仍有諸多局限性,訓(xùn)練時(shí)也有各種各樣問題。比如最原始的互饋神經(jīng)網(wǎng)絡(luò)因?yàn)橛?xùn)練時(shí)的梯度消失或者梯度爆炸的問題很難直接應(yīng)用。從互饋神經(jīng)網(wǎng)絡(luò)拓展出的一些模型,比如現(xiàn)在處理時(shí)序相關(guān)信息常用的LSTM(長(zhǎng)短期記憶網(wǎng)絡(luò))模型,雖然LSTM模型在一些場(chǎng)景上取得了較好的應(yīng)用,但是存在著算法復(fù)雜,并且整合時(shí)間域上的信息長(zhǎng)度有限的問題。現(xiàn)有的深度學(xué)習(xí)模型在處理時(shí)序相關(guān)的任務(wù)時(shí)表現(xiàn)明顯不如處理靜態(tài)輸入時(shí)有效。
而在一些當(dāng)前人工智能領(lǐng)域具有代表性的運(yùn)動(dòng)物體識(shí)別或者動(dòng)作識(shí)別數(shù)據(jù)集上,表現(xiàn)較好的模型基本都嘗試通過卷積神經(jīng)網(wǎng)絡(luò)提取視頻每幀靜態(tài)圖片的特征信息,加上LSTM模型或者融合視頻的光流信息,以期能得到較好的時(shí)空信息的整合。但是這些模型都缺少對(duì)于時(shí)間域上的信息進(jìn)行顯式的整合的過程。
發(fā)明內(nèi)容
針對(duì)現(xiàn)有技術(shù)的不足,本發(fā)明所要解決的首要技術(shù)問題在于提供一種基于生物大腦認(rèn)知和抉擇機(jī)理的運(yùn)動(dòng)物體識(shí)別方法。
本發(fā)明所要解決的另一技術(shù)問題在于提供一種基于生物大腦認(rèn)知和抉擇機(jī)理的運(yùn)動(dòng)物體識(shí)別系統(tǒng)。
為實(shí)現(xiàn)上述發(fā)明目的,本發(fā)明采用下述的技術(shù)方案:
根據(jù)本發(fā)明實(shí)施例的第一方面,提供一種基于生物大腦認(rèn)知和抉擇機(jī)理的運(yùn)動(dòng)物體識(shí)別方法,包括如下步驟:
S11,通過對(duì)各類運(yùn)動(dòng)物體進(jìn)行分析,得到庫網(wǎng)絡(luò)模塊到抉擇模塊的連接權(quán)重;所述抉擇模塊根據(jù)連接權(quán)重對(duì)輸入信號(hào)進(jìn)行證據(jù)強(qiáng)度的累積,并作出類別判斷;
S12,將運(yùn)動(dòng)物體的視頻按單幀輸入到庫網(wǎng)絡(luò)模塊中,將低維的輸入信號(hào)投影至高維的庫網(wǎng)絡(luò)活動(dòng)空間,獲得任意時(shí)刻庫網(wǎng)絡(luò)活動(dòng)的向量;
S13,通過任意時(shí)刻庫網(wǎng)絡(luò)活動(dòng)的向量以及庫網(wǎng)絡(luò)活動(dòng)到抉擇模塊的連接權(quán)重,得到運(yùn)動(dòng)物體所屬各個(gè)類別的證據(jù)強(qiáng)度;
S14,將運(yùn)動(dòng)物體所屬各個(gè)類別的證據(jù)強(qiáng)度輸入抉擇模塊,抉擇模塊的各個(gè)抉擇神經(jīng)元根據(jù)輸入的各個(gè)類別的證據(jù)強(qiáng)度進(jìn)行積累,重復(fù)步驟S12~S13,當(dāng)視頻輸入完成后,選擇累積的證據(jù)強(qiáng)度超過抉擇閾值的抉擇神經(jīng)元,得到運(yùn)動(dòng)物體所屬的類別。
其中較優(yōu)地,在步驟S11中,采用遞歸最小二乘法對(duì)各類運(yùn)動(dòng)物體進(jìn)行分析,得到庫網(wǎng)絡(luò)模塊到抉擇模塊的連接權(quán)重。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于北京師范大學(xué),未經(jīng)北京師范大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810955609.2/2.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 上一篇:基于深度神經(jīng)網(wǎng)絡(luò)的廢棄飲料瓶與易拉罐分類識(shí)別的方法
- 下一篇:基于塊稀疏貝葉斯學(xué)習(xí)的變體目標(biāo)高分辨距離像識(shí)別方法
- 同類專利
- 專利分類
G06K 數(shù)據(jù)識(shí)別;數(shù)據(jù)表示;記錄載體;記錄載體的處理
G06K9-00 用于閱讀或識(shí)別印刷或書寫字符或者用于識(shí)別圖形,例如,指紋的方法或裝置
G06K9-03 .錯(cuò)誤的檢測(cè)或校正,例如,用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標(biāo)記或含有代碼標(biāo)記的打印字符的,例如,由不同形狀的各個(gè)筆畫組成的,而且每個(gè)筆畫表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理,即無須判定關(guān)于圖像的同一性而進(jìn)行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合
- 三維大腦磁共振圖像的大腦皮層表面上腦溝區(qū)域分割方法
- 用于確定大腦狀態(tài)的方法和系統(tǒng)
- 融合圖像體素及先驗(yàn)?zāi)X圖譜劃分的大腦網(wǎng)絡(luò)構(gòu)建方法
- 用于在大腦的實(shí)時(shí)圖像上重疊NBS功能數(shù)據(jù)的方法和系統(tǒng)
- 用于大腦的功能性成像的方法和裝置
- 一種采用人體克隆加大腦移植實(shí)現(xiàn)人“重生”的方法
- 一種基于深度循環(huán)自編碼器的大腦活動(dòng)檢測(cè)方法
- 用于大腦的功能性成像的方法和裝置
- 數(shù)據(jù)中心冷源站控制系統(tǒng)及其控制方法
- 一種大腦功能網(wǎng)絡(luò)中時(shí)間穩(wěn)定社團(tuán)檢測(cè)方法
- 一種認(rèn)知無線網(wǎng)絡(luò)系統(tǒng)和認(rèn)知網(wǎng)元設(shè)備
- 認(rèn)知無線電網(wǎng)絡(luò)中小區(qū)邊界用戶的頻譜共享方法
- 基于頻譜襯墊和填充的認(rèn)知OFDM網(wǎng)絡(luò)資源分配方法
- 認(rèn)知障礙數(shù)據(jù)處理方法以及處理系統(tǒng)
- 一種認(rèn)知無線電頻譜共享方法、設(shè)備和系統(tǒng)
- 認(rèn)知無線電系統(tǒng)的頻譜共享方法及管理終端
- 一種具有仿反饋調(diào)整機(jī)制的脫機(jī)手寫體漢字認(rèn)知方法
- 一種基于人件服務(wù)的態(tài)勢(shì)認(rèn)知計(jì)算架構(gòu)
- 一種認(rèn)知評(píng)估的信息化方法、系統(tǒng)及可讀存儲(chǔ)介質(zhì)
- 一種認(rèn)知負(fù)荷評(píng)價(jià)方法、裝置、系統(tǒng)及存儲(chǔ)介質(zhì)





