[發明專利]一種基于卷積神經網絡的數字助聽器聲源定向方法在審
| 申請號: | 201910077998.8 | 申請日: | 2019-01-28 |
| 公開(公告)號: | CN109862498A | 公開(公告)日: | 2019-06-07 |
| 發明(設計)人: | 陳霏;張雨晨 | 申請(專利權)人: | 天津大學 |
| 主分類號: | H04R25/00 | 分類號: | H04R25/00 |
| 代理公司: | 天津市三利專利商標代理有限公司 12107 | 代理人: | 韓新城 |
| 地址: | 300072*** | 國省代碼: | 天津;12 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 助聽器 智能終端 語音數據 聲源 卷積神經網絡 數字助聽器 方向數據 神經網絡訓練 采集 方向信息 建立通信 實時接收 輸出 語音 播放 外部 制作 | ||
1.一種基于卷積神經網絡的數字助聽器聲源定向方法,其特征在于,包括以下步驟:
制作訓練用的語音數據,播放該語音數據并利用助聽器及智能終端采集;
將助聽器與智能終端采集的訓練用的語音數據作為輸入、聲源方向數據為輸出進行神經網絡訓練,并將訓練完成后的卷積神經網絡輸入智能終端中;
使用時,將助聽器與智能終端建立通信連接,助聽器接收到外部語音后傳送給智能終端,所述卷積神經網絡根據助聽器接收的語音數據以及智能終端實時接收的語音數據,輸出聲源方向數據后發回給助聽器。
2.如權利要求1所述基于卷積神經網絡的數字助聽器聲源定向方法,其特征在于,在將語音數據輸入到所述卷積神經網絡之前,還包括對語音數據前處理的步驟:首先對語音數據預處理,然后用梅爾倒譜系數法提取語音信號特征,將語音信號通過梅爾濾波器組轉化為24維特征信號;通過對語音分幀時的幀長調整,使梅爾濾波器組生成的信號為24×24的數據方陣;
將助聽器左右耳語音數據中的左耳幅度信息、左耳相位信息、右耳幅度信號、右耳相位信息與智能終端語音數據中的幅度信息的五個維度的數據,整合成一個24×24×5的矩陣作為卷積神經網絡輸入,得到聲源方向數據。
3.如權利要求2所述基于卷積神經網絡的數字助聽器聲源定向方法,其特征在于,所述的卷積神經網絡為七層結構,從輸入到輸出依次為第一卷積層、池化層、第二卷積層、三層全連接層、softmax層,輸入24×24×5的語音數據矩陣后將得到一個90維向量輸出。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于天津大學,未經天津大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910077998.8/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種傳聲器
- 下一篇:高性能聲電轉換模組、大功率助聽器模塊及耳背式助聽器





