[發明專利]一種基于聲音識別的地鐵站臺安全監測方法在審
| 申請號: | 202011246625.8 | 申請日: | 2020-11-10 |
| 公開(公告)號: | CN112349296A | 公開(公告)日: | 2021-02-09 |
| 發明(設計)人: | 楊霞;胡添杰 | 申請(專利權)人: | 胡添杰 |
| 主分類號: | G10L25/24 | 分類號: | G10L25/24;G10L25/30;G10L25/51;B61B1/02 |
| 代理公司: | 濟南鼎信專利商標代理事務所(普通合伙) 37245 | 代理人: | 賈國浩 |
| 地址: | 063000 河北省*** | 國省代碼: | 河北;13 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 聲音 識別 地鐵 站臺 安全 監測 方法 | ||
1.一種基于聲音識別的地鐵站臺安全監測方法,其特征在于,包括聲音采集步驟和聲音識別步驟,
所述聲音采集步驟包括步驟:
S11、在站臺不同區域安裝聲音采集裝置,每個聲音采集裝置都有位置標記;
S12、利用聲音采集裝置實時采集周圍的聲音;
S13、過濾掉聲音采集裝置所采集的聲音中的地鐵站播報的聲音后,將過濾后的聲音發送至聲音識別步驟;
所述聲音識別步驟包括步驟:
S21、收集各種正常情況下地鐵站臺的聲音,建立正常聲音數據集;
S22、收集和呼救聲、突發事件有關的關鍵字聲音,建立異常呼救聲音數據集;
S23、搭建具有呼救語音識別模型的聲音識別器,所述呼救語音識別模型包括特征提取、聲學模型、語言模型以及字典與解碼;
S24、訓練呼救語音識別模型,使用異常呼救聲音數據集和正常聲音數據集兩個字典集,將已經標記了所屬聲音類別的聲音數據作為訓練樣本,提取聲學特征MFCC,把每一幀波形變成一個包含聲音信息的多維特征向量,向基于深度神經網絡模型輸入特征向量,輸出音素信息,根據聲學特性計算每一個特征向量在聲學特征上的得分,進而識別出呼救聲和風險等級;
S25、利用聲音識別器識別聲音采集裝置傳輸的聲音,當識別出呼救聲音或突發事件聲音時,選擇獲取異常聲音最大的聲音采集裝置的位置作為距離異常事發地最近的位置,將這個位置和異常聲音發送給司機和相關工作人員,并提供識別出的聲音的風險等級。
2.根據權利要求1所述的一種基于聲音識別的地鐵站臺安全監測方法,其特征在于:所述正常聲音數據集包括乘客的嘈雜聲、火車進出站的聲音、地鐵站語音播報的聲音。
3.根據權利要求1所述的一種基于聲音識別的地鐵站臺安全監測方法,其特征在于:所述異常呼救聲音數據集包括分貝突然變大的聲音,對于分貝突然變大的聲音,呼救語音識別模型不再識別異常聲音的語義,而是僅判斷其與正常聲音特征的相似度,如果差異性很大,則可識別為異常聲音。
4.根據權利要求1所述的一種基于聲音識別的地鐵站臺安全監測方法,其特征在于:所述突發事件有關的聲音包括尖叫聲、爆炸聲、爭吵聲、摔打聲。
5.根據權利要求1所述的一種基于聲音識別的地鐵站臺安全監測方法,其特征在于:所述語音識別模型的語言模型采用循環神經網絡模型。
6.根據權利要求5所述的一種基于聲音識別的地鐵站臺安全監測方法,其特征在于:所述循環神經網絡模型為RNN或LSTM,所述循環神經網絡模型先將收集到的用于訓練的聲音切分成固定時長的語音段落,并提取每個語音段落的MFCC特征參數,然后將MFCC特征參數經過特征歸一化處理計算后輸入網絡模型進行訓練,訓練將輸出損失降低到目標范圍內,完成訓練后得到語音識別聲學模型。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于胡添杰,未經胡添杰許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011246625.8/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種混凝土水化溫升抑制劑及其制備方法
- 下一篇:柔性接頭成型方法





