[發(fā)明專利]基于語音端點檢測的人工耳蝸自動增益控制方法和系統(tǒng)有效
| 申請?zhí)枺?/td> | 201310062108.9 | 申請日: | 2013-02-28 |
| 公開(公告)號: | CN103190965A | 公開(公告)日: | 2013-07-10 |
| 發(fā)明(設(shè)計)人: | 平利川;陳洪斌;唐國芳;王松 | 申請(專利權(quán))人: | 杭州諾爾康神經(jīng)電子科技有限公司 |
| 主分類號: | A61F2/18 | 分類號: | A61F2/18;G10L15/05 |
| 代理公司: | 北京風(fēng)雅頌專利代理有限公司 11403 | 代理人: | 李弘;李翔 |
| 地址: | 310011 浙江省*** | 國省代碼: | 浙江;33 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 基于 語音 端點 檢測 人工 耳蝸 自動增益控制 方法 系統(tǒng) | ||
技術(shù)領(lǐng)域
本發(fā)明涉及電子耳蝸技術(shù)領(lǐng)域,特別是指一種基于語音端點檢測的人工耳蝸自動增益控制方法和系統(tǒng)。
背景技術(shù)
人的耳蝸毛細胞是接收聲音的感覺細胞。當耳蝸毛細胞損傷嚴重時,就會出現(xiàn)嚴重的聽力損傷。電子耳蝸就是替代已損傷毛細胞,通過電刺激聽覺神經(jīng)重新獲得聲音信號的一種電子裝置。圖1顯示的是電子耳蝸的結(jié)構(gòu)示意圖。電子耳蝸由體外機部件和植入體部件兩部分組成,體外機部件主要包括傳聲器(如麥克風(fēng)等)、言語處理器和發(fā)射線圈,植入體部件主要包括接收線圈、刺激器及多通道電極陣列組成。
在系統(tǒng)連接正常的情況下,麥克風(fēng)接收聲信號,通過言語處理器,將聲信號進行分析處理并編碼,通過頭件(發(fā)射線圈)透過皮膚傳送到植入體部件的接收線圈,經(jīng)過刺激器的解碼處理后,產(chǎn)生相應(yīng)頻率及電流強度的脈沖信號并傳送到各個刺激電極。通過電極刺激聽神經(jīng),將脈沖信號傳到聽覺中樞從而為使用者產(chǎn)生聽覺。
對于正常聽力者而言,聲音的響度承受范圍是120dB,而對于人工耳蝸植入者,電刺激的動態(tài)范圍僅有5-15dB左右。設(shè)計人工耳蝸言語處理的一個重要指標是輸入聲信號的動態(tài)范圍,這決定了將多少動態(tài)范圍的聲信號壓縮到5-15dB的電刺激動態(tài)范圍上。
一般助聽器或人工耳蝸的自動增益系統(tǒng)以前一段時間輸入的聲信號聲強作為調(diào)整增益的依據(jù),增益調(diào)整的啟動及恢復(fù)的時間是自動增益調(diào)整的核心參數(shù)。在助聽器中,一般認為20ms左右的啟動時間,200ms左右的恢復(fù)時間會讓佩戴者最為舒適。而在人工耳蝸中200ms左右的啟動時間,1s左右的恢復(fù)時間會讓人工耳蝸植入者較為舒適。
但在復(fù)雜的聽音環(huán)境中,或是人工耳蝸植入者自己大聲說話時,傳統(tǒng)的自動增益系統(tǒng)可能會頻繁的啟動及恢復(fù),會導(dǎo)致人工耳蝸植入者在聽音時感覺聲音忽大忽小。
發(fā)明內(nèi)容
有鑒于此,本發(fā)明的目的在于提出一種基于語音端點檢測的人工耳蝸自動增益控制方法和系統(tǒng),提升了人工耳蝸使用者的聽音能力,改善植入者對聲強輸入波動較大時的言語識別效果。
基于上述目的本發(fā)明提供的一種基于語音端點檢測的人工耳蝸自動增益控制方法,包括以下步驟:
采集外界的聲信號,并將采集的聲信號進行放大處理;其中,放大處理的增益值設(shè)置有默認增益和嘈雜環(huán)境默認增益;在對初次采集的聲信號進行放大處理時,初始增益值設(shè)置成默認增益;
將放大后的聲信號轉(zhuǎn)換成數(shù)字信號;
計算數(shù)字信號的短時能量,然后根據(jù)短時能量計算背景噪聲值;
讀取當前增益值,若讀取的增益值為默認增益,則設(shè)置語音短時能量的高門限,將輸入的短時能量與語音短時能量的高門限進行比較,找出將放大處理時的初始增益值進行調(diào)整的語音端點的幀,即增益值調(diào)整的開始;若讀取的增益值為嘈雜環(huán)境默認增益,則設(shè)置語音短時能量的低門限和過零率的高門限,將輸入的短時能量與語音短時能量的低門限進行比較,再通過過零率的判斷,確定語音的間隙,并在語音間隙將放大處理的增益值恢復(fù)為初始值;
對轉(zhuǎn)換的數(shù)字信號進行分頻處理,并將處理的結(jié)果合并為N個通道;對N個通道的每個包絡(luò)能量進行聲-電刺激壓縮并輸出。
可選地,計算數(shù)字信號的短時能量:首先,令輸入的短時語音(通常取一幀20ms)信號為S(n);根據(jù)公式:Sw(n)=S(n)*G,得到放大后的語音信號Sw(n);其中,G為當前放大處理時的增益值;
然后,根據(jù)放大后的語音信號Sw(n)得到短時能量E為:
進一步地,根據(jù)短時能量計算背景噪聲值:
首先,分別計算4個連續(xù)的20ms短時能量的均值;
然后,對此連續(xù)80ms的短時能量進行累加平均:En=(E1+E2+E3+E4)/4;其中,E1,E2,E3,E4分別為4個連續(xù)20ms短時能量的均值;根據(jù)上述方法計算8s左右的時間內(nèi),每連續(xù)80ms的短時能量的均值,即En(1)至En(100);
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于杭州諾爾康神經(jīng)電子科技有限公司,未經(jīng)杭州諾爾康神經(jīng)電子科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201310062108.9/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
A61F 可植入血管內(nèi)的濾器;假體;為人體管狀結(jié)構(gòu)提供開口、或防止其塌陷的裝置,例如支架
A61F2-00 可植入血管中的濾器;假體,即用于人體各部分的人造代用品或取代物;用于假體與人體相連的器械;對人體管狀結(jié)構(gòu)提供開口或防止塌陷的裝置, 例如支架
A61F2-01 .可植入血管內(nèi)的濾器
A61F2-02 .能移植到體內(nèi)的假體
A61F2-50 .不能移植在人體內(nèi)的假體
A61F2-82 .為人體管狀結(jié)構(gòu)提供開口、或防止塌陷的裝置, 例如支架
A61F2-84 .. 專門適用于其放置或移去的器械





