[發明專利]人工耳蝸聽覺場景識別方法在審
| 申請號: | 201811276582.0 | 申請日: | 2018-10-30 |
| 公開(公告)號: | CN109448702A | 公開(公告)日: | 2019-03-08 |
| 發明(設計)人: | 樊偉;劉新東;劉根芳;魏清 | 申請(專利權)人: | 上海力聲特醫學科技有限公司 |
| 主分類號: | G10L15/02 | 分類號: | G10L15/02;G10L15/06;G10L15/16;G10L15/26;G10L25/18;G10L25/45 |
| 代理公司: | 上海申浩律師事務所 31280 | 代理人: | 唐佳弟;秦華毅 |
| 地址: | 201318 *** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 聽覺場景 人工耳蝸 特征提取 程序模塊 語音處理器 場景 預處理程序模塊 預處理 信號處理模塊 輸出 場景識別 刺激信號 加窗處理 信號處理 音樂場景 語音信號 語音增強 噪聲環境 可懂度 概率 分幀 預設 植入 匹配 運算 判定 相符 | ||
1.一種人工耳蝸聽覺場景識別方法,其包括如下步驟:(A)預處理程序模塊將聲音信號進行分幀與加窗處理;(B)特征提取程序模塊將預處理后的聲音信號進行特征提?。?C)場景識別程序模塊將特征提取后的聲音信號進行CNN運算,得出各預設場景的概率值,將概率值最大的場景判定為最終場景。
2.如權利要求1所述的人工耳蝸聽覺場景識別方法,其特征在于:在步驟A中,該加窗處理使用Hamming窗或Hanning窗。
3.如權利要求2所述的人工耳蝸聽覺場景識別方法,其特征在于:Hamming窗:其中,窗長N=256,幀移取128。
4.如權利要求1所述的人工耳蝸聽覺場景識別方法,其特征在于:在步驟B中,該特征向量提取采用MFCC、FBank或語譜圖。
5.如權利要求4所述的人工耳蝸聽覺場景識別方法,其特征在于:Fbank的特征提取流程:對預處理輸出的每一幀聲音信號進行FFT變換:X[i,k]=FFT[xi(m)];對每一幀FFT后的數據計算譜線能量:E[i,k]=[xi(k)]2;計算Mel濾波器能量:其中,Hm(k)為Mel濾波器的頻率響應,m為Mel濾波器個數,這里取40;取對數運算:Fbank=log[S(i,m)]。
6.如權利要求1所述的人工耳蝸聽覺場景識別方法,其特征在于:在步驟C中,該CNN包括輸入層,中間層及輸出層,其中,該輸入層為聲音信號特征構成的二維數據矩陣,該中間層包括卷積輸出層,池化輸出層以及全連接輸出層,該全連接輸出層由一個一維數據組成,該池化輸出層比該卷積輸出層少一個。
7.如權利要求6所述的人工耳蝸聽覺場景識別方法,其特征在于:池化處理采用Maxpooling或Meanpooling。
8.如權利要求7所述的人工耳蝸聽覺場景識別方法,其特征在于:激活函數使用ReLU、sigmoid、tanh或Logistic,其中,ReLU公式:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于上海力聲特醫學科技有限公司,未經上海力聲特醫學科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811276582.0/1.html,轉載請聲明來源鉆瓜專利網。





