[發明專利]一種基于稀疏編碼的音頻場景識別方法在審

申請號：	201610387696.7	申請日：	2016-06-02
公開（公告）號：	CN107464556A	公開（公告）日：	2017-12-12
發明（設計）人：	徐杰;陳訓遜;王博;王東安;包秀國	申請（專利權）人：	國家計算機網絡與信息安全管理中心
主分類號：	G10L15/02	分類號：	G10L15/02;G10L15/06;G10L19/005
代理公司：	北京華仲龍騰專利代理事務所(普通合伙)11548	代理人：	黃玉玨
地址：	100029***	國省代碼：	北京;11
權利要求書：	查看更多	說明書：	查看更多
摘要：
搜索關鍵詞：	一種基于稀疏編碼音頻場景識別方法
鉆瓜網技術展會專利詞庫專利權人專利榜在售專利公布日期熱門專利

【權利要求書】：

1.一種基于稀疏編碼的音頻場景識別方法，其特征在于，包括如下步驟：

(1)原子庫生成；對目標場景的訓練音頻信號樣本進行訓練，得到一個目標場景的原子庫D1，對于目標集外的訓練音頻信號樣本進行訓練，得到一個集外的原子庫D2；原子庫D1中的原子，是具有目標場景特點的；而集外原子庫D2中的原子，則不具有目標場景的特點；

將音頻信號定義為X＝[x₁,x₂,…,x_n]，其中音頻信號的特征為m維，λ為正則化參數，原子庫D有k列，每列都是一個原子，其中m和k的大小遠小于n，且滿足原子庫的冗余性和過完備，即m小于k；信號在過完備冗余原子庫上的分解具有稀疏性；

由樣本X訓練得到的原子庫D，對于每一個樣本中的音頻信號，進行稀疏表示；對于樣本X在D上分解的系數設為α＝[α₁,α₂,…,α_n]，原子庫的學習，就是建立一個樣本在稀疏表示時，能夠使用最少的原子進行表示的原子庫,如下式：

fn(D)=1nΣi=1nminα∈Rk12||x-Dα||22+λ||α||1---(0.1)]]>

(2)對待測的音頻信號，將音頻信號在原子庫D上進行分解，得到一個稀疏的系數α；

根據這個系數中不為零的項，找到這些項在原子庫中對應的原子，統計這些原子的類別標簽，其中對應目標場景的音頻信號統計值為集外音頻信號統計值為k1為目標場景的原子庫D1的原子數，k2為集外的原子庫D2的原子數；

(3)比較統計值R_t和R_o的大小，較大的統計值對應的場景即為識別結果。

下載完整專利技術內容需要扣除積分，VIP會員可以免費下載。

免登錄下載普通用戶下載升級VIP會員，免費下載

該專利技術資料僅供研究查看技術是否侵權等信息，商用須獲得專利權人授權。該專利全部權利屬于國家計算機網絡與信息安全管理中心，未經國家計算機網絡與信息安全管理中心許可，擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作，請聯系【客服】

本文鏈接：http://www.szxzyx.cn/pat/books/201610387696.7/1.html，轉載請聲明來源鉆瓜專利網。

專利分類

專利文獻下載

說明：

1、專利原文基于中國國家知識產權局專利說明書；

2、支持發明專利、實用新型專利、外觀設計專利（升級中）；

3、專利數據每周兩次同步更新，支持Adobe PDF格式；

4、內容包括專利技術的結構示意圖、流程工藝圖或技術構造圖；

5、已全新升級為極速版,下載速度顯著提升！歡迎使用！

請您登陸后，進行下載，點擊【登陸】【注冊】