[發(fā)明專(zhuān)利]一種基于BMFCC-GBFB-DNN的機(jī)電設(shè)備視聽(tīng)信息融合方法有效
| 申請(qǐng)?zhí)枺?/td> | 202010974747.2 | 申請(qǐng)日: | 2020-09-16 |
| 公開(kāi)(公告)號(hào): | CN112101462B | 公開(kāi)(公告)日: | 2022-04-19 |
| 發(fā)明(設(shè)計(jì))人: | 王松;胡燕祝;徐小鳳 | 申請(qǐng)(專(zhuān)利權(quán))人: | 北京郵電大學(xué) |
| 主分類(lèi)號(hào): | G06K9/62 | 分類(lèi)號(hào): | G06K9/62;G06V10/80;G06V10/82;G06N3/04;G10L17/18;G10L17/20 |
| 代理公司: | 暫無(wú)信息 | 代理人: | 暫無(wú)信息 |
| 地址: | 100876 *** | 國(guó)省代碼: | 北京;11 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 bmfcc gbfb dnn 機(jī)電設(shè)備 視聽(tīng) 信息 融合 方法 | ||
本發(fā)明涉及基于BMFCC?GBFB?DNN的機(jī)電設(shè)備視聽(tīng)信息融合方法,是一種對(duì)對(duì)現(xiàn)代化機(jī)電設(shè)備運(yùn)行過(guò)程中分布式視覺(jué)信息和聽(tīng)覺(jué)信息融合的方法,屬于目標(biāo)追蹤與神經(jīng)網(wǎng)絡(luò)領(lǐng)域,其特征在于采用如下步驟:(1)提取MFCC特征,確定聽(tīng)覺(jué)信息的F比;(2)確定MFCC參數(shù)加權(quán)后的表達(dá)式;(3)MFCC參數(shù)進(jìn)行主成分分析;(4)提取聽(tīng)覺(jué)信息的GBFB特征;(5)將卷積后結(jié)果分解為子塊矩陣;(6)圖像的可聽(tīng)化處理;(7)搭建DNN架構(gòu)。本發(fā)明利用BMFCC及GBFB提取聽(tīng)覺(jué)信息特征,極大地提高了特征的代表性和噪聲的魯棒性。利用DNN神經(jīng)網(wǎng)絡(luò)對(duì)視聽(tīng)信息融合,一定程度上提高了內(nèi)容的豐富性以及融合的實(shí)時(shí)性。這說(shuō)明本算法在機(jī)電設(shè)備視聽(tīng)信息融合時(shí),能達(dá)到很好的效果。
技術(shù)領(lǐng)域
本發(fā)明涉及目標(biāo)追蹤與神經(jīng)網(wǎng)絡(luò)領(lǐng)域,主要是一種對(duì)現(xiàn)代化機(jī)電設(shè)備運(yùn)行過(guò)程中分布式視覺(jué)信息和聽(tīng)覺(jué)信息融合的方法。
背景技術(shù)
目前,感知信息融合技術(shù)在目標(biāo)追蹤領(lǐng)域具有廣泛的應(yīng)用性,因此對(duì)機(jī)電設(shè)備視聽(tīng)信息融合的研究成為研究熱點(diǎn)。現(xiàn)有的信息大多局限于圖像或視頻格式的視覺(jué)信息,聽(tīng)覺(jué)信息并沒(méi)有被很好的利用起來(lái)。將兩者信息融合起來(lái),克服視覺(jué)和聽(tīng)覺(jué)信息獨(dú)立存在的缺陷,獲取全面的信息成為研究問(wèn)題的關(guān)鍵。常見(jiàn)的將視覺(jué)信息可聽(tīng)化多是對(duì)空間域圖像像素灰度以及像素位置進(jìn)行映射,其映射結(jié)果的準(zhǔn)確性及實(shí)時(shí)性隨圖像內(nèi)容復(fù)雜度的影響。傳統(tǒng)的視聽(tīng)信息融合通常采用決策級(jí)融合算法,因?yàn)樘崛√卣鬟^(guò)程中經(jīng)過(guò)似然度計(jì)算和大量的人工處理,其結(jié)果并不能真實(shí)反映視聽(tīng)結(jié)果的特征。
作為現(xiàn)代眾多領(lǐng)域研究的熱點(diǎn),視聽(tīng)信息融合已經(jīng)達(dá)到了成熟的階段,本設(shè)計(jì)在已存在的成功算法基礎(chǔ)上,結(jié)合眾多算法的優(yōu)點(diǎn),進(jìn)行算法的改善。提出的聽(tīng)覺(jué)信息特征的提取,有很好的抗噪性,對(duì)噪聲具有很好的魯棒性。視聽(tīng)信息特征級(jí)融合將視聽(tīng)信號(hào)特征融合形成特征矢量,一定程度上提高了內(nèi)容的豐富性以及融合的實(shí)時(shí)性。特征提取的代表性,圖像可聽(tīng)化的準(zhǔn)確性,視聽(tīng)信息融合的實(shí)時(shí)性,要求我們建立一種高效的算法,實(shí)現(xiàn)機(jī)電設(shè)備視聽(tīng)信息的提取及融合過(guò)程在穩(wěn)定性的基礎(chǔ)上提高效率,有效減少算法時(shí)間,為目標(biāo)領(lǐng)域的應(yīng)用提供精確有效的融合信息,促進(jìn)現(xiàn)代經(jīng)濟(jì)的現(xiàn)代化發(fā)展,保障國(guó)防事業(yè)的安全。
發(fā)明內(nèi)容
針對(duì)上述現(xiàn)有技術(shù)中存在的問(wèn)題,本發(fā)明要解決的技術(shù)問(wèn)題是提供一種基于BMFCC-GBFB-DNN的機(jī)電設(shè)備視聽(tīng)信息融合方法,其具體流程如圖1所示。
技術(shù)方案實(shí)施步驟如下:
(1)提取MFCC特征,確定分布式光纖信號(hào)聽(tīng)覺(jué)信息的F比F(k):
式中,F(xiàn)between(k)為第k維分量均值的方差,F(xiàn)within(k)為第k維分量的方差之和。
(2)確定MFCC參數(shù)加權(quán)后的表達(dá)式C(n):
首先,根據(jù)F比圖特點(diǎn),假設(shè)加權(quán)系數(shù)表達(dá)式為:
ci=a+bsin(π·i/p)
式中,p為濾波器階數(shù),i=0,1,…,p-1,a為加權(quán)系數(shù)的靜態(tài)分量,b為加權(quán)系數(shù)的線(xiàn)性分量。根據(jù)經(jīng)驗(yàn)細(xì)化a,b值,確定MFCC參數(shù)加權(quán)后的表達(dá)式C(n):
式中,M代表濾波器階數(shù),m為對(duì)應(yīng)的分布式光纖聽(tīng)覺(jué)信息的幀數(shù),s(m)為對(duì)應(yīng)于m幀的分布式光纖聽(tīng)覺(jué)信息。
(3)MFCC參數(shù)進(jìn)行主成分分析:
對(duì)加權(quán)處理過(guò)的特征分量求差分,ΔWMFCC為特征分量一階差分,Δ2WMFCC為特征分量二階差分。將三者組成一組特定維數(shù)的MFCC參數(shù)。
對(duì)得到的參數(shù)進(jìn)行PCA主成分分析,確定相關(guān)矩陣T:
該專(zhuān)利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專(zhuān)利權(quán)人授權(quán)。該專(zhuān)利全部權(quán)利屬于北京郵電大學(xué),未經(jīng)北京郵電大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買(mǎi)此專(zhuān)利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010974747.2/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專(zhuān)利網(wǎng)。
- 上一篇:一種基于HRTF-PSO-FCM的無(wú)人機(jī)偵察視覺(jué)信息可聽(tīng)化方法
- 下一篇:一種基于多尺度變換與ADCensus-JWGF的機(jī)電設(shè)備視覺(jué)信息立體匹配算法
- 同類(lèi)專(zhuān)利
- 專(zhuān)利分類(lèi)
G06K 數(shù)據(jù)識(shí)別;數(shù)據(jù)表示;記錄載體;記錄載體的處理
G06K9-00 用于閱讀或識(shí)別印刷或書(shū)寫(xiě)字符或者用于識(shí)別圖形,例如,指紋的方法或裝置
G06K9-03 .錯(cuò)誤的檢測(cè)或校正,例如,用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標(biāo)記或含有代碼標(biāo)記的打印字符的,例如,由不同形狀的各個(gè)筆畫(huà)組成的,而且每個(gè)筆畫(huà)表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理,即無(wú)須判定關(guān)于圖像的同一性而進(jìn)行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合
- 經(jīng)由輸出分布來(lái)學(xué)習(xí)學(xué)生DNN
- 深度神經(jīng)網(wǎng)絡(luò)DNN模型的壓縮方法、裝置、設(shè)備及介質(zhì)
- 用于深度神經(jīng)網(wǎng)絡(luò)訓(xùn)練的有效數(shù)據(jù)編碼
- 固態(tài)圖像捕獲裝置、信息處理裝置、信息處理系統(tǒng)、信息處理方法和程序
- 固態(tài)成像系統(tǒng)、固態(tài)成像裝置、信息處理裝置、圖像處理方法、信息處理方法和程序
- 用于對(duì)圖像執(zhí)行人工智能編碼和人工智能解碼的方法和設(shè)備
- 一種海洋通信系統(tǒng)聯(lián)合信道分類(lèi)、估計(jì)和檢測(cè)方法
- DNN程序文檔自動(dòng)生成方法
- 一種物聯(lián)網(wǎng)場(chǎng)景下的DNN劃分方法及裝置
- 一種用于ReID的神經(jīng)網(wǎng)絡(luò)構(gòu)造方法及其訓(xùn)練方法





