[發明專利]聲音識別方法和系統在審
| 申請號: | 201811290201.4 | 申請日: | 2018-10-31 |
| 公開(公告)號: | CN109243496A | 公開(公告)日: | 2019-01-18 |
| 發明(設計)人: | 沈松 | 申請(專利權)人: | 東方智測(北京)科技有限公司 |
| 主分類號: | G10L25/84 | 分類號: | G10L25/84;G10L25/30;G10L25/51;G10L21/0208;G10L21/04;H04L29/08;G10L21/0216 |
| 代理公司: | 北京律智知識產權代理有限公司 11438 | 代理人: | 闞梓瑄;袁禮君 |
| 地址: | 100085 北京*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 聲音識別 離散數字信號 學習神經網絡 特征量 交通噪聲 聲音類型 聲音轉換 實時獲取 實時優化 準確率 申請 | ||
本申請提供一種聲音識別方法和系統,該方法包括:實時獲取聲音,所述聲音包括交通噪聲;將所述聲音轉換為離散數字信號以及特征量;根據所述離散數字信號以及所述特征量實時優化深度學習神經網絡模型;利用深度學習神經網絡模型對所述聲音進行識別。本申請的聲音識別方法和系統,能夠準確識別道路中出現的聲音類型,并在識別過程中自動提高識別準確率。
技術領域
本申請涉及智能交通領域,尤其涉及一種聲音識別方法和系統。
背景技術
道路交通中,會產生許多不同的聲音,隨著智能交通技術的快速發展,對不同類型的聲音進行及時而準確的識別就變得尤為重要。例如:
(1)對機動車鳴喇叭聲、非法改裝跑車的發動機轟聲的識別,有利于糾正違法行為,創建安靜文明的城市交通環境。
(2)對有警笛聲的特種車輛的識別,有利于實現交通的智能疏導。
(3)對貨車、小客車、大客車和摩托車行駛噪聲的識別,有利于交通噪聲分布的研究。
(4)對緊急剎車聲、撞擊聲的識別,有利于交通事故的及時發現,尤其對于遠離城市的高速公路。
(5)其他情形的聲音,例如爆炸聲、強烈喊叫聲,有利于突發事件的應急反應。
但是,由于交通聲音千變萬化,不同類型的聲音又具有非常相似的特性;而同一類別的聲音也會有較大差異,例如喇叭聲,不同型號的喇叭,或者安裝在不同車輛上的相同喇叭,其聲音特征也是千差萬別,因此準確識別這些典型交通聲音是非常困難的。當無法確定各個類型聲音的統一特征時,聲音識別的理論數學模型也難以確立。
發明內容
有鑒于此,本申請提供一種識別聲音方法和系統,能夠準確識別道路中出現的聲音類型,并在識別過程中自動提高識別準確率。
本申請的其他特性和優點將通過下面的詳細描述變得顯然,或部分地通過本申請的實踐而習得。
根據本申請實施例的第一方面,提出一種聲音識別方法,該方法包括:實時獲取聲音,所述聲音包括交通噪聲;將所述聲音轉換為離散數字信號以及特征量;根據所述離散數字信號以及所述特征量實時優化深度學習神經網絡模型;利用深度學習神經網絡模型對所述聲音進行識別。
在本申請的一種示例性實施例中,實時獲取聲音包括:實時采集環境聲音;以及在所述環境聲音滿足第一條件時,實時獲取所述聲音。
在本申請的一種示例性實施例中,將所述聲音轉換為離散數字信號以及特征量包括:通過模數轉換器得到離散數字信號;通過數字信號處理提取所述聲音的特征向量。
在本申請的一種示例性實施例中,根據所述離散數字信號以及所述特征量實時優化深度學習神經網絡模型,包括:將所述離散數字信號以及所述特征量輸入深度學習神經網絡模型;獲取深度學習神經網絡模型的輸出向量,所述輸出向量為所述聲音與多個預定聲音類型的相似度;根據所述輸出向量確定所述聲音的類型標簽;根據所述離散數字信號、所述特征量以及所述樣本標簽優化深度學習神經網絡模型。
在本申請的一種示例性實施例中,根據所述輸出向量確定所述聲音的類型標簽包括:當判斷所述輸出向量中每一個元素的極值大于或等于閾值時,確定所述聲音的類型標簽;當判斷輸出向量中每一個元素的數值均小于閾值時,確定所述聲音的類型標簽。
在本申請的一種示例性實施例中,所述特征量包括下述特征中的至少一種:時域特征量;頻域特征量;時頻特征量。
在本申請的一種示例性實施例中,還包括:根據深度學習神經網絡模型的輸出向量調整閾值。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于東方智測(北京)科技有限公司,未經東方智測(北京)科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811290201.4/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:語音檢測方法及裝置
- 下一篇:語音喚醒的控制方法及裝置





