[發明專利]人工耳蝸聽覺場景識別方法在審

申請號：	201811276582.0	申請日：	2018-10-30
公開（公告）號：	CN109448702A	公開（公告）日：	2019-03-08
發明（設計）人：	樊偉;劉新東;劉根芳;魏清	申請（專利權）人：	上海力聲特醫學科技有限公司
主分類號：	G10L15/02	分類號：	G10L15/02;G10L15/06;G10L15/16;G10L15/26;G10L25/18;G10L25/45
代理公司：	上海申浩律師事務所 31280	代理人：	唐佳弟;秦華毅
地址：	201318 ***	國省代碼：	上海;31
權利要求書：	查看更多	說明書：	查看更多
摘要：
搜索關鍵詞：	聽覺場景人工耳蝸特征提取程序模塊語音處理器場景預處理程序模塊預處理信號處理模塊輸出場景識別刺激信號加窗處理信號處理音樂場景語音信號語音增強噪聲環境可懂度概率分幀預設植入匹配運算判定相符
鉆瓜網技術展會專利詞庫專利權人專利榜在售專利公布日期熱門專利

【權利要求書】：

1.一種人工耳蝸聽覺場景識別方法，其包括如下步驟：(A)預處理程序模塊將聲音信號進行分幀與加窗處理；(B)特征提取程序模塊將預處理后的聲音信號進行特征提?。?C)場景識別程序模塊將特征提取后的聲音信號進行CNN運算，得出各預設場景的概率值，將概率值最大的場景判定為最終場景。

2.如權利要求1所述的人工耳蝸聽覺場景識別方法，其特征在于：在步驟A中，該加窗處理使用Hamming窗或Hanning窗。

3.如權利要求2所述的人工耳蝸聽覺場景識別方法，其特征在于：Hamming窗：其中，窗長N＝256，幀移取128。

4.如權利要求1所述的人工耳蝸聽覺場景識別方法，其特征在于：在步驟B中，該特征向量提取采用MFCC、FBank或語譜圖。

5.如權利要求4所述的人工耳蝸聽覺場景識別方法，其特征在于：Fbank的特征提取流程：對預處理輸出的每一幀聲音信號進行FFT變換:X[i,k]＝FFT[x_i(m)]；對每一幀FFT后的數據計算譜線能量：E[i,k]＝[x_i(k)]²；計算Mel濾波器能量：其中，H_m(k)為Mel濾波器的頻率響應，m為Mel濾波器個數，這里取40；取對數運算：Fbank＝log[S(i,m)]。

6.如權利要求1所述的人工耳蝸聽覺場景識別方法，其特征在于：在步驟C中，該CNN包括輸入層，中間層及輸出層，其中，該輸入層為聲音信號特征構成的二維數據矩陣，該中間層包括卷積輸出層，池化輸出層以及全連接輸出層，該全連接輸出層由一個一維數據組成，該池化輸出層比該卷積輸出層少一個。

7.如權利要求6所述的人工耳蝸聽覺場景識別方法，其特征在于：池化處理采用Maxpooling或Meanpooling。

8.如權利要求7所述的人工耳蝸聽覺場景識別方法，其特征在于：激活函數使用ReLU、sigmoid、tanh或Logistic，其中，ReLU公式：

下載完整專利技術內容需要扣除積分，VIP會員可以免費下載。

免登錄下載普通用戶下載升級VIP會員，免費下載

該專利技術資料僅供研究查看技術是否侵權等信息，商用須獲得專利權人授權。該專利全部權利屬于上海力聲特醫學科技有限公司，未經上海力聲特醫學科技有限公司許可，擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作，請聯系【客服】

本文鏈接：http://www.szxzyx.cn/pat/books/201811276582.0/1.html，轉載請聲明來源鉆瓜專利網。