[發明專利]音頻環境分類的系統和方法有效

申請號：	201380058948.6	申請日：	2013-10-25
公開（公告）號：	CN104781875B	公開（公告）日：	2016-11-02
發明（設計）人：	里昂納德·亨利·葛羅科普	申請（專利權）人：	高通股份有限公司
主分類號：	G10L17/00	分類號：	G10L17/00;H04M1/725;G10L15/065
代理公司：	北京律盟知識產權代理有限責任公司 11287	代理人：	宋獻濤
地址：	美國加利***	國省代碼：	美國;US
權利要求書：	查看更多	說明書：	查看更多
摘要：
搜索關鍵詞：	音頻環境分類系統方法
鉆瓜網技術展會專利詞庫專利權人專利榜在售專利公布日期熱門專利

【說明書】：

技術領域

本發明涉及無線通信領域。明確地說，本發明涉及音頻環境分類的系統和方法。

背景技術

可將低功率始終接通音頻環境分類設想為用于智能手機的情境感知應用的啟用程序。雖然已試圖促進監督(即，預先訓練的)音頻分類，但此監督音頻分類的執行可能被混淆，這是因為給定周圍音頻環境的正確語義標簽可能常常為用戶特定的。舉例來說，一個人的家里的周圍環境可能聽起來好像另一個人的辦公室的周圍環境。另外，常規音頻分類方法可為計算上密集的，從而使得此類方法不適于以低功率始終接通方式來實施。關于常規音頻分類方法的另一個問題是對隱私的關注，這是因為可存儲原始音頻樣本。

發明內容

一種根據本發明的分類音頻環境的方法的實例包含根據第一時間間隔對所述音頻環境進行取樣以獲得經取樣音頻數據，計算所述經取樣音頻數據的特征，根據第二時間間隔從經取樣音頻數據的所述特征推斷音頻群集標識符，以及根據第三時間間隔使用經取樣音頻數據的所述特征更新音頻環境模型。

所述方法的實施方案可包含以下特征中的一者或一者以上。計算所述經取樣音頻數據的特征可包含計算多個梅爾頻率倒譜系數(mel-frequency?ceptral?coefficient；MFCC)，在所述第一時間間隔內使用所述多個MFCC產生對MFCC數據的統計的連續估計，以及存儲對MFCC數據的統計的所述連續估計。產生對MFCC數據的統計的連續估計可包含將所述多個MFCC加到與所述音頻環境的所述多個MFCC的平均值成比例的估計，以及將所述多個MFCC的平方加到與所述音頻環境的所述多個MFCC的方差成比例的估計。推斷所述音頻群集標識符可包含讀取對MFCC數據的統計的所述連續估計、先前所存儲的音頻環境模型和先前所確定的音頻環境概率分布；使用對MFCC數據的統計的所述連續估計、所述先前所存儲的音頻環境模型和所述先前所確定的音頻環境概率分布計算當前音頻環境概率分布；用所述當前音頻環境概率分布替換所述先前所確定的音頻環境概率分布；根據所述當前音頻環境概率分布推斷當前音頻群集標識符；以及將對MFCC數據的統計的所述連續估計存儲為MFCC統計。更新所述音頻環境模型可包含讀取所述MFCC統計，使用所述MFCC統計更新所述音頻環境模型，以及將所述音頻環境模型存儲在存儲裝置中。對所述音頻環境進行取樣可在20毫秒到30毫秒之間的持續時間內執行，推斷所述音頻群集標識符可在1毫秒到100毫秒之間的持續時間內執行，且更新所述音頻環境模型可在1分鐘到20分鐘之間的持續時間內執行。第一時間間隔可實質上比第二時間間隔短，且第二時間間隔可實質上比第三時間間隔短。第一時間間隔可在0.5秒到3秒之間，第二時間間隔可在30秒到120秒之間，且第三時間間隔可在6小時到24小時之間。音頻群集標識符可表示周圍音頻環境。

一種根據本發明的分類音頻環境的設備的實例包含存儲器單元；處理器，所述處理器經編程以進行以下操作：根據第一時間間隔對所述音頻環境進行取樣以獲得經取樣音頻數據；計算所述經取樣音頻數據的特征；根據第二時間間隔從經取樣音頻數據的所述特征推斷音頻群集標識符，以便將所述音頻群集標識符存儲在所述存儲器單元中；以及根據第三時間間隔使用經取樣音頻數據的所述特征更新音頻環境模型。

下載完整專利技術內容需要扣除積分，VIP會員可以免費下載。

免登錄下載普通用戶下載升級VIP會員，免費下載

該專利技術資料僅供研究查看技術是否侵權等信息，商用須獲得專利權人授權。該專利全部權利屬于高通股份有限公司，未經高通股份有限公司許可，擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作，請聯系【客服】

本文鏈接：http://www.szxzyx.cn/pat/books/201380058948.6/2.html，轉載請聲明來源鉆瓜專利網。