[發(fā)明專利]一種聲學(xué)目標事件監(jiān)控方法有效
| 申請?zhí)枺?/td> | 201710800615.6 | 申請日: | 2017-09-07 |
| 公開(公告)號: | CN109473119B | 公開(公告)日: | 2023-04-07 |
| 發(fā)明(設(shè)計)人: | 管魯陽;鮑明 | 申請(專利權(quán))人: | 中國科學(xué)院聲學(xué)研究所 |
| 主分類號: | G10L25/30 | 分類號: | G10L25/30;G10L25/03 |
| 代理公司: | 北京方安思達知識產(chǎn)權(quán)代理有限公司 11472 | 代理人: | 陳琳琳;武玥 |
| 地址: | 100190 *** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 聲學(xué) 目標 事件 監(jiān)控 方法 | ||
本發(fā)明公開了一種聲學(xué)目標事件監(jiān)控方法,所述方法包括:步驟1)建立樣本集,所述樣本集包括訓(xùn)練集和測試集;步驟2)構(gòu)建并訓(xùn)練深度神經(jīng)網(wǎng)絡(luò),所述深度神經(jīng)網(wǎng)絡(luò)為結(jié)合遞歸網(wǎng)絡(luò)結(jié)構(gòu)的卷積神經(jīng)網(wǎng)絡(luò),用于提取聲學(xué)信號的信號特征;步驟3)構(gòu)建并訓(xùn)練多個任務(wù)辨識網(wǎng)絡(luò);步驟4)利用訓(xùn)練好的深度神經(jīng)網(wǎng)絡(luò)和多個任務(wù)辨識網(wǎng)絡(luò),對實時采集的聲學(xué)信號進行目標類別辨識;步驟5)當辨識出的目標屬于監(jiān)控的事件范圍內(nèi),根據(jù)系統(tǒng)設(shè)置執(zhí)行監(jiān)控策略。本發(fā)明的方法可以解決為智能交通、城市環(huán)境監(jiān)測、特定建筑物內(nèi)公共區(qū)域聲學(xué)監(jiān)測等應(yīng)用,用于特定目標事件的發(fā)現(xiàn)、定位和遠距離聲信號獲取,能夠提高城市的噪聲源目標監(jiān)控技術(shù)水平。
技術(shù)領(lǐng)域
本發(fā)明涉及環(huán)境聲學(xué)監(jiān)測、人群語音監(jiān)測、公共安全監(jiān)測等領(lǐng)域,具體涉及一種聲學(xué)目標事件監(jiān)控方法。
背景技術(shù)
目前在針對多種公共或野外環(huán)境下的聲學(xué)監(jiān)測相關(guān)應(yīng)用中,根據(jù)不同的應(yīng)用目標和領(lǐng)域,形成了多種多樣的聲學(xué)信號采集處理設(shè)備或系統(tǒng),比如雷聲監(jiān)測定位、爆炸聲監(jiān)測、環(huán)境噪聲污染水平監(jiān)測等。這些不同的監(jiān)測目標通常采用不同的聲學(xué)信號處理方法,比如設(shè)置不同的信號采樣率、目標信號特征提取方法等。
目前通常是針對某些目標設(shè)定信號處理方法、特征提取識別方法等,搜集相應(yīng)數(shù)據(jù)進行分類器訓(xùn)練。一旦完成之后就形成固定的目標識別分類器,難以再增加或改變所辨識目標的類型。
發(fā)明內(nèi)容
本發(fā)明的目的在于克服上述問題,針對環(huán)境噪聲監(jiān)測應(yīng)用提出了一種統(tǒng)一的信號特征分析提取與識別的方法,為多種采樣率信號、不同目標聲信號的處理與辨識提供一個統(tǒng)一基于深度學(xué)習(xí)的技術(shù)框架。
為了實現(xiàn)上述目的,本發(fā)明提出了一種聲學(xué)目標事件監(jiān)控方法,所述方法包括:
步驟1)建立樣本集,所述樣本集包括訓(xùn)練集和測試集;
步驟2)構(gòu)建并訓(xùn)練深度神經(jīng)網(wǎng)絡(luò),所述深度神經(jīng)網(wǎng)絡(luò)為結(jié)合遞歸網(wǎng)絡(luò)結(jié)構(gòu)的卷積神經(jīng)網(wǎng)絡(luò),用于提取聲學(xué)信號的信號特征;
步驟3)構(gòu)建并訓(xùn)練多個任務(wù)辨識網(wǎng)絡(luò);
步驟4)利用訓(xùn)練好的深度神經(jīng)網(wǎng)絡(luò)和多個任務(wù)辨識網(wǎng)絡(luò),對實時采集的聲學(xué)信號進行目標類別辨識;
步驟5)當辨識出的目標屬于監(jiān)控的事件范圍內(nèi),根據(jù)系統(tǒng)設(shè)置執(zhí)行監(jiān)控策略。
作為上述方法的一種改進,所述步驟1)具體為:
采集已有的或在線監(jiān)測所得到的大量聲信號數(shù)據(jù),處理后得到每個信號的傅立葉短時譜;傅立葉短時譜是多幀信號進行傅里葉變換后得到的二維頻譜信息,二維分別表示時間和頻率,所述樣本集包括若干個樣本,每個樣本包括:聲信號的傅立葉短時譜,聲信號的標簽。
作為上述方法的一種改進,所述步驟2)具體包括:
步驟201)構(gòu)建深度神經(jīng)網(wǎng)絡(luò);所述深度神經(jīng)網(wǎng)絡(luò)是一個改進卷積神經(jīng)網(wǎng)絡(luò),是將傳統(tǒng)的卷積神經(jīng)網(wǎng)絡(luò)結(jié)合遞歸網(wǎng)絡(luò)結(jié)構(gòu),形成可利用歷史信息對聲信號進行特征分析提取與判別的深度神經(jīng)網(wǎng)絡(luò);
步驟202)使用樣本集進行無監(jiān)督學(xué)習(xí),優(yōu)化所述深度神經(jīng)網(wǎng)絡(luò)參數(shù):網(wǎng)絡(luò)規(guī)模、權(quán)系數(shù)及控制參數(shù)。
作為上述方法的一種改進,所述步驟3)具體包括:
步驟301)根據(jù)不同任務(wù)場景、不同需要和不同任務(wù)目標,構(gòu)建多個任務(wù)辨識網(wǎng)絡(luò),所述任務(wù)辨識網(wǎng)絡(luò)使用單層或多層網(wǎng)絡(luò)形式;
步驟302)將深度神經(jīng)網(wǎng)絡(luò)提取的樣本集的每個聲信號的目標特征作為多個任務(wù)辨識網(wǎng)絡(luò)的輸入,根據(jù)已知的該聲學(xué)信號的標簽進行反向訓(xùn)練,訓(xùn)練出多個任務(wù)辨識網(wǎng)絡(luò)的參數(shù)。
作為上述方法的一種改進,所述步驟302)的多個任務(wù)辨識網(wǎng)絡(luò)的輸入還可以增加基于信號處理的部分參數(shù):信號短時能量和事件持續(xù)時間。
作為上述方法的一種改進,所述步驟4)具體包括:
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于中國科學(xué)院聲學(xué)研究所,未經(jīng)中國科學(xué)院聲學(xué)研究所許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710800615.6/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 用于語音識別的聲學(xué)模型訓(xùn)練方法及裝置
- 具有集成聲學(xué)發(fā)生器的聲學(xué)發(fā)射傳感器
- 聲學(xué)發(fā)射傳感器裝置
- 一種基于空間折疊聲學(xué)超材料的單傳感器聲學(xué)相機
- 聲學(xué)環(huán)境中的聲學(xué)信號的基于上下文的消除和放大
- 聲學(xué)結(jié)構(gòu)和聲學(xué)系統(tǒng)
- 具有外放和私密操作模式的可穿戴個人聲學(xué)設(shè)備
- 聲換能器系統(tǒng)
- 一種聲學(xué)模型的訓(xùn)練方法、裝置以及計算機可讀存儲介質(zhì)
- 一種基于聲學(xué)暗室的聲學(xué)相位中心校準方法及系統(tǒng)
- 多級校內(nèi)監(jiān)控系統(tǒng)
- 多級校內(nèi)監(jiān)控系統(tǒng)
- 一種范圍廣、力度大的校內(nèi)監(jiān)控系統(tǒng)
- 一種監(jiān)控的方法及系統(tǒng)
- 設(shè)備的監(jiān)控方法、裝置、系統(tǒng)和空調(diào)
- 多級校內(nèi)監(jiān)控系統(tǒng)
- 設(shè)備監(jiān)控方法、裝置、計算機設(shè)備及存儲介質(zhì)
- 風(fēng)險雷達預(yù)警的監(jiān)控方法及系統(tǒng)
- 區(qū)塊鏈網(wǎng)絡(luò)監(jiān)控系統(tǒng)、裝置及方法
- 基于機器視覺的車站客流安全智能監(jiān)控系統(tǒng)





