[發(fā)明專利]音頻信號處理裝置和方法以及監(jiān)控系統(tǒng)有效
| 申請?zhí)枺?/td> | 201310344110.5 | 申請日: | 2013-08-08 |
| 公開(公告)號: | CN104347068B | 公開(公告)日: | 2020-05-22 |
| 發(fā)明(設計)人: | 劉昆 | 申請(專利權(quán))人: | 索尼公司 |
| 主分類號: | G10L15/08 | 分類號: | G10L15/08 |
| 代理公司: | 北京集佳知識產(chǎn)權(quán)代理有限公司 11227 | 代理人: | 康建峰;苗迎華 |
| 地址: | 日本*** | 國省代碼: | 暫無信息 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 音頻 信號 處理 裝置 方法 以及 監(jiān)控 系統(tǒng) | ||
1.一種音頻信號處理裝置,包括:
分窗單元,用于利用滑動窗順次讀取輸入的音頻信號;
能量計算單元,用于計算每一窗中的音頻信號的每一幀的能量;
分段單元,用于根據(jù)每一窗中的音頻信號的每一幀的能量的分布將所述窗中的音頻信號劃分為多個段,使得每個段中包括能量接近的連續(xù)幀;
分類單元,用于利用至少一個聲音模型對每個段中的音頻信號進行分類;以及
識別單元,用于根據(jù)所述分類單元的分類結(jié)果來識別每個段中的音頻信號的聲音類別。
2.根據(jù)權(quán)利要求1的音頻信號處理裝置,其中,所述分段單元包括:
聚類單元,用于將所述窗中的幀的能量按大小聚類為多個簇,每個簇中包含大小接近的多個能量;以及
段形成單元,用于將同一簇中的連續(xù)幀形成一個段。
3.根據(jù)權(quán)利要求2的音頻信號處理裝置,其中,所述聚類單元分別以所述窗的能量序列中的最大能量和最小能量為中心,根據(jù)最近鄰原則將所述窗的能量序列聚類為兩個簇,以及分別以每個簇的能量序列中的最大能量和最小能量為中心,根據(jù)最近鄰原則迭代地對每個簇的能量序列進行聚類,直到不再滿足聚類條件為止,
其中,所述窗中的幀的能量組成的序列作為所述窗的能量序列,每個簇中的幀的能量組成的序列作為所述簇的能量序列,并且所述聚類條件為:從窗的能量序列或簇的能量序列所聚類出的兩個簇的能量序列的分布與單高斯分布的相似度之和比所述窗的能量序列的分布或所述簇的能量序列的分布與單高斯分布的相似度高預定程度。
4.根據(jù)權(quán)利要求2的音頻信號處理裝置,其中,所述分段單元還包括:
能量規(guī)整單元,用于在所述聚類單元進行聚類之前對所述窗中的幀的能量組成的序列進行規(guī)整,以增大所述序列中的能量之間的差異性。
5.根據(jù)權(quán)利要求1的音頻信號處理裝置,其中,
所述分類單元利用異常聲音模型和背景聲音模型對每個段中的音頻信號的每一幀進行分類,
所述音頻信號處理裝置還包括加權(quán)單元,用于根據(jù)每一幀屬于異常聲音的可信度對所述分類單元對每一幀的分類結(jié)果進行加權(quán),其中可信度越大,分類結(jié)果的權(quán)重越高,并且
所述識別單元根據(jù)每一幀加權(quán)后的分類結(jié)果來識別每個段中的音頻信號的聲音類別。
6.根據(jù)權(quán)利要求5的音頻信號處理裝置,其中,所述加權(quán)單元使用以下三項中的任意一項或任意多項的組合作為每一幀屬于異常聲音的可信度:
每一幀音頻信號相對于前一幀音頻信號的能量變化;
每一幀音頻信號與異常聲音模型的相似度和所述幀音頻信號與背景聲音模型的相似度的差;以及
每一幀所在的段中包含的連續(xù)幀的個數(shù)。
7.根據(jù)權(quán)利要求1的音頻信號處理裝置,還包括能量平滑單元,用于在所述分段單元對所述窗中的音頻信號進行劃分之前,對所述窗中的音頻信號的每一幀的能量進行平滑。
8.一種音頻信號處理方法,包括:
利用滑動窗順次讀取輸入的音頻信號;
計算每一窗中的音頻信號的每一幀的能量;
根據(jù)每一窗中的音頻信號的每一幀的能量的分布將所述窗中的音頻信號劃分為多個段,使得每個段中包括能量接近的連續(xù)幀;
利用至少一個聲音模型對每個段中的音頻信號進行分類;以及
根據(jù)分類結(jié)果來識別每個段中的音頻信號的聲音類別。
9.根據(jù)權(quán)利要求8的音頻信號處理方法,其中,根據(jù)每一窗中的音頻信號的每一幀的能量的分布將所述窗中的音頻信號劃分為多個段包括:
將所述窗中的幀的能量按大小聚類為多個簇,每個簇中包含大小接近的多個能量;以及
將同一簇中的連續(xù)幀形成一個段。
該專利技術資料僅供研究查看技術是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于索尼公司,未經(jīng)索尼公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201310344110.5/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 信號調(diào)制方法、信號調(diào)制裝置、信號解調(diào)方法和信號解調(diào)裝置
- 亮度信號/色信號分離裝置和亮度信號/色信號分離方法
- 信號調(diào)制方法、信號調(diào)制裝置、信號解調(diào)方法和信號解調(diào)裝置
- 信號調(diào)制方法、信號調(diào)制裝置、信號解調(diào)方法和信號解調(diào)裝置
- 雙耳信號的信號生成
- 雙耳信號的信號生成
- 信號處理裝置、信號處理方法、信號處理程序
- USBTYPEC信號轉(zhuǎn)HDMI信號的信號轉(zhuǎn)換線
- 信號盒(信號轉(zhuǎn)換)
- 信號調(diào)制方法、信號調(diào)制裝置、信號解調(diào)方法和信號解調(diào)裝置





