[發明專利]一種基于稀疏編碼的音頻場景識別方法在審
| 申請號: | 201610387696.7 | 申請日: | 2016-06-02 |
| 公開(公告)號: | CN107464556A | 公開(公告)日: | 2017-12-12 |
| 發明(設計)人: | 徐杰;陳訓遜;王博;王東安;包秀國 | 申請(專利權)人: | 國家計算機網絡與信息安全管理中心 |
| 主分類號: | G10L15/02 | 分類號: | G10L15/02;G10L15/06;G10L19/005 |
| 代理公司: | 北京華仲龍騰專利代理事務所(普通合伙)11548 | 代理人: | 黃玉玨 |
| 地址: | 100029*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 稀疏 編碼 音頻 場景 識別 方法 | ||
1.一種基于稀疏編碼的音頻場景識別方法,其特征在于,包括如下步驟:
(1)原子庫生成;對目標場景的訓練音頻信號樣本進行訓練,得到一個目標場景的原子庫D1,對于目標集外的訓練音頻信號樣本進行訓練,得到一個集外的原子庫D2;原子庫D1中的原子,是具有目標場景特點的;而集外原子庫D2中的原子,則不具有目標場景的特點;
將音頻信號定義為X=[x1,x2,…,xn],其中音頻信號的特征為m維,λ為正則化參數,原子庫D有k列,每列都是一個原子,其中m和k的大小遠小于n,且滿足原子庫的冗余性和過完備,即m小于k;信號在過完備冗余原子庫上的分解具有稀疏性;
由樣本X訓練得到的原子庫D,對于每一個樣本中的音頻信號,進行稀疏表示;對于樣本X在D上分解的系數設為α=[α1,α2,…,αn],原子庫的學習,就是建立一個樣本在稀疏表示時,能夠使用最少的原子進行表示的原子庫,如下式:
(2)對待測的音頻信號,將音頻信號在原子庫D上進行分解,得到一個稀疏的系數α;
根據這個系數中不為零的項,找到這些項在原子庫中對應的原子,統計這些原子的類別標簽,其中對應目標場景的音頻信號統計值為集外音頻信號統計值為k1為目標場景的原子庫D1的原子數,k2為集外的原子庫D2的原子數;
(3)比較統計值Rt和Ro的大小,較大的統計值對應的場景即為識別結果。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于國家計算機網絡與信息安全管理中心,未經國家計算機網絡與信息安全管理中心許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201610387696.7/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:香熏加濕機
- 下一篇:月餅包裝盒(喜氣洋洋賀中秋)





