[發明專利]一種基于卷積神經網絡的數字助聽器聲源定向方法在審
| 申請號: | 201910077998.8 | 申請日: | 2019-01-28 |
| 公開(公告)號: | CN109862498A | 公開(公告)日: | 2019-06-07 |
| 發明(設計)人: | 陳霏;張雨晨 | 申請(專利權)人: | 天津大學 |
| 主分類號: | H04R25/00 | 分類號: | H04R25/00 |
| 代理公司: | 天津市三利專利商標代理有限公司 12107 | 代理人: | 韓新城 |
| 地址: | 300072*** | 國省代碼: | 天津;12 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 助聽器 智能終端 語音數據 聲源 卷積神經網絡 數字助聽器 方向數據 神經網絡訓練 采集 方向信息 建立通信 實時接收 輸出 語音 播放 外部 制作 | ||
本發明公開一種基于卷積神經網絡的數字助聽器聲源定向方法,包括步驟:制作訓練用的語音數據,播放該語音數據并利用助聽器及智能終端采集;將助聽器與智能終端采集的訓練用的語音數據作為輸入、聲源方向數據為輸出進行神經網絡訓練,并將訓練完成后的卷積神經網絡輸入智能終端中;使用時,將助聽器與智能終端建立通信連接,助聽器接收到外部語音后傳送給智能終端,所述卷積神經網絡根據助聽器接收的語音數據以及智能終端實時接收的語音數據,輸出聲源方向數據后發回給助聽器。本發明能準確得出聲源相對于助聽器使用者的方向信息。
技術領域
本發明涉及聲源定向技術領域,特別是涉及一種基于卷積神經網絡的數字助聽器聲源定向方法。
背景技術
聽力損失是現今常見的幾種慢性疾病之一,尤其多發于老年人。據世界衛生組織2018年公布的信息,全球有4.66億人患有殘疾性聽力損失,每年造成花費高達7500億美元,超過三分之一的65歲以上老年人患有殘疾性聽力損失。聽力損失對患者的影響是巨大的,例如,輕、中、重度聽力損失的老年人,阿爾茨海默癥的患病率分別是聽力正常老人的2倍、3倍和5倍。并且聽力損失還可能會引發重度失眠、認知衰退、抑郁等極為嚴重的心理問題。
助聽器對于聽力損失者的聽力改善可以起到一定的輔助作用,并且對聽力損失的恢復也有極大的幫助。因此,世界衛生組織建議殘疾性聽力損失者佩戴合適的助聽器。傳統的模擬式助聽器采用線性放大電路,將輸入的所有音頻信號進行線性放大處理。但是由于助聽器使用者往往對聲音信號不敏感,常常會產生“小聲聽不清、大聲聽得難受”的窘境。為解決這個問題,可以根據用戶不同聽力損失情況進行放大的數字助聽器應運而生。數字助聽器需要對接收到的語音信號進行一系列處理,然而助聽器使用者的生活環境中往往存在各類噪聲,對助聽器的語音處理效果產生巨大的影響。倘若助聽器能夠像人類大腦一樣輕松確定聲源的方向,就可以進行語音方向性增強等進一步處理,大大提高用戶的使用體驗。但現今已有的數字助聽器要么沒有利用聲源定向技術,要么利用了計算復雜但效果一般的傳統聲源定向技術,語音處理效果還有很大的提升空間。
發明內容
本發明的目的是針對現有技術中存在的技術缺陷,而提供一種基于卷積神經網絡的數字助聽器聲源定向方法,其借助卷積神經網絡模型,構建了一種效果更好的助聽器聲源定向方法,旨在解決現有助聽器聲源方向信息不足、語音信號處理效果欠佳等問題,以期提高助聽器使用者的使用體驗以及能提高助聽器聲源定向準確率。
為實現本發明的目的所采用的技術方案是:
一種基于卷積神經網絡的數字助聽器聲源定向方法,包括以下步驟:
制作訓練用的語音數據,播放該語音數據并利用助聽器及智能終端采集;
將助聽器與智能終端采集的訓練用的語音數據作為輸入、聲源方向數據為輸出進行神經網絡訓練,并將訓練完成后的卷積神經網絡輸入智能終端中;
使用時,將助聽器與智能終端建立通信連接,助聽器接收到外部語音后傳送給智能終端,所述卷積神經網絡根據助聽器接收的語音數據以及智能終端實時接收的語音數據,輸出聲源方向數據后發回給助聽器。
在將語音數據輸入到所述卷積神經網絡之前,還包括對語音數據前處理的步驟:首先對語音數據預處理,然后用梅爾倒譜系數法提取語音信號特征,將語音信號通過梅爾濾波器組轉化為24維特征信號;通過對語音分幀時的幀長調整,使梅爾濾波器組生成的信號為24×24的數據方陣;
將助聽器左右耳語音數據中的左耳幅度信息、左耳相位信息、右耳幅度信號、右耳相位信息與智能終端語音數據中的幅度信息的五個維度的數據,整合成一個24×24×5的矩陣作為卷積神經網絡輸入,得到聲源方向數據。
所述的卷積神經網絡為七層結構,從輸入到輸出依次為第一卷積層、池化層、第二卷積層、三層全連接層、softmax層,輸入24×24×5的語音數據矩陣后將得到一個90維向量輸出。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于天津大學,未經天津大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910077998.8/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種傳聲器
- 下一篇:高性能聲電轉換模組、大功率助聽器模塊及耳背式助聽器





