[發(fā)明專利]一種智能語(yǔ)音處理方法有效
| 申請(qǐng)?zhí)枺?/td> | 201410081493.6 | 申請(qǐng)日: | 2014-03-05 |
| 公開(公告)號(hào): | CN103811020A | 公開(公告)日: | 2014-05-21 |
| 發(fā)明(設(shè)計(jì))人: | 王義;魏陽(yáng)杰;陳瑤;關(guān)楠 | 申請(qǐng)(專利權(quán))人: | 東北大學(xué) |
| 主分類號(hào): | G10L21/0272 | 分類號(hào): | G10L21/0272;G10L15/07 |
| 代理公司: | 沈陽(yáng)東大知識(shí)產(chǎn)權(quán)代理有限公司 21109 | 代理人: | 梁焱 |
| 地址: | 110819 遼寧*** | 國(guó)省代碼: | 遼寧;21 |
| 權(quán)利要求書: | 查看更多 | 說(shuō)明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 智能 語(yǔ)音 處理 方法 | ||
技術(shù)領(lǐng)域
本發(fā)明屬于信息處理技術(shù)領(lǐng)域,具體涉及一種智能語(yǔ)音處理方法。
背景技術(shù)
據(jù)2013年世界衛(wèi)生組織(WHO)發(fā)布的最新評(píng)估數(shù)據(jù)顯示,全球目前共有3.6億人存在不同程度的聽力障礙,占全球總?cè)丝诘?%。助聽產(chǎn)品的使用可以有效地補(bǔ)償聽力障礙患者的聽力損失,提高他們的生活和工作質(zhì)量。然而,當(dāng)今助聽系統(tǒng)相關(guān)技術(shù)的研究仍然集中在噪聲抑制和源聲音幅值放大兩個(gè)方面,很少涉及到基于聲音特征的建模和多聲源自動(dòng)分離技術(shù)。當(dāng)實(shí)際應(yīng)用場(chǎng)景非常復(fù)雜時(shí),例如:聚會(huì)時(shí),多個(gè)說(shuō)話人同時(shí)發(fā)聲,甚至是伴有音樂等背景聲音,由于助聽系統(tǒng)無(wú)法從混合后的聲音輸入中分離出感興趣的聲音對(duì)象,簡(jiǎn)單的聲音強(qiáng)度擴(kuò)大功能只能增加使用者的聽力負(fù)擔(dān)甚至傷害,不會(huì)帶來(lái)有效的聲音輸入和理解。因此,針對(duì)當(dāng)前助聽系統(tǒng)的技術(shù)缺陷,設(shè)計(jì)一款具有特定聲音對(duì)象識(shí)別功能的、更加智能化和個(gè)性化的新型助聽系統(tǒng),具有非常重要的意義。
發(fā)明內(nèi)容
針對(duì)現(xiàn)有技術(shù)存在的不足,本發(fā)明提出一種智能語(yǔ)音處理方法,以達(dá)到保證用戶根據(jù)自己的需求獲得純凈的聲音接收和放大,實(shí)現(xiàn)助聽系統(tǒng)的智能化、互動(dòng)化和個(gè)性化的目的。
一種智能語(yǔ)音處理方法,包括以下步驟:
步驟1、采集樣本語(yǔ)音段構(gòu)建樣本語(yǔ)音庫(kù),對(duì)樣本語(yǔ)音進(jìn)行特征提取,獲得特征參數(shù),并對(duì)特征參數(shù)進(jìn)行訓(xùn)練;
具體過(guò)程如下:
步驟1-1、采集樣本語(yǔ)音段,將采集的語(yǔ)音段進(jìn)行離散化處理,提取語(yǔ)音信號(hào)的梅爾頻率倒譜系數(shù)作為語(yǔ)音信號(hào)特征參數(shù),并建立高斯混合模型;
模型公式如下:
其中,p(XIG)表示樣本語(yǔ)音特征參數(shù)在模型參數(shù)為G的模型中的概率;
G表示高斯混合模型參數(shù)集,G={pi,μi,∑i},i=1,2,...,I;
I表示高斯混合模型中單一高斯模型個(gè)數(shù);
pi表示第i個(gè)單一高斯模型的權(quán)重系數(shù),
μi表示第i個(gè)單一高斯模型的均值矢量;
∑i表示第i個(gè)單一高斯模型的協(xié)方差矩陣;
X表示樣本語(yǔ)音特征參數(shù),X={x1,x2,...,xT},T表示特征向量的個(gè)數(shù);
bi(X)表示第i個(gè)單一高斯模型的密度函數(shù),bi(X)=N(μi,∑i),N(.)表示標(biāo)準(zhǔn)高斯分布的密度函數(shù);
步驟1-2、利用語(yǔ)音信號(hào)特征參數(shù)訓(xùn)練高斯混合模型;
即采用k均值聚類算法對(duì)語(yǔ)音信號(hào)特征參數(shù)進(jìn)行聚類,獲得高斯混合模型參數(shù)集初始值G0={pi0,μi0,∑i0},i=1,2,...,I;并根據(jù)獲得的高斯混合模型參數(shù)集初始值,采用最大期望算法對(duì)模型進(jìn)行估計(jì),進(jìn)而獲得高斯混合模型參數(shù),即完成特征參數(shù)的訓(xùn)練;
步驟2、采用M個(gè)麥克風(fēng)組成的麥克風(fēng)陣列采集被測(cè)環(huán)境音頻信號(hào),確定該環(huán)境聲音源個(gè)數(shù)和每個(gè)聲音源波束到達(dá)的方向,即聲源到麥克風(fēng)陣列的入射角度;
具體過(guò)程如下:
步驟2-1、采用M個(gè)麥克風(fēng)組成的麥克風(fēng)陣列采集被測(cè)環(huán)境的混合音頻信號(hào),并對(duì)采集的混合音頻信號(hào)進(jìn)行離散化處理,獲得每個(gè)采樣點(diǎn)的幅值;
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于東北大學(xué),未經(jīng)東北大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201410081493.6/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
- 用于語(yǔ)音處理的方法與系統(tǒng)
- 一種語(yǔ)音識(shí)別測(cè)試系統(tǒng)及方法
- 用于語(yǔ)音識(shí)別的方法和裝置
- 一種語(yǔ)音消毒柜的控制方法及語(yǔ)音消毒柜
- 一種語(yǔ)音處理方法及裝置
- 混合語(yǔ)音識(shí)別方法、裝置及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)
- 語(yǔ)音情緒識(shí)別方法、系統(tǒng)、移動(dòng)終端及存儲(chǔ)介質(zhì)
- 一種具有語(yǔ)音識(shí)別功能的智能語(yǔ)音終端設(shè)備
- 語(yǔ)音增強(qiáng)方法、裝置、電子設(shè)備和存儲(chǔ)介質(zhì)
- 一種聲紋鑒定語(yǔ)音重組方法和系統(tǒng)
- 一種數(shù)據(jù)庫(kù)讀寫分離的方法和裝置
- 一種手機(jī)動(dòng)漫人物及背景創(chuàng)作方法
- 一種通訊綜合測(cè)試終端的測(cè)試方法
- 一種服裝用人體測(cè)量基準(zhǔn)點(diǎn)的獲取方法
- 系統(tǒng)升級(jí)方法及裝置
- 用于虛擬和接口方法調(diào)用的裝置和方法
- 線程狀態(tài)監(jiān)控方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)
- 一種JAVA智能卡及其虛擬機(jī)組件優(yōu)化方法
- 檢測(cè)程序中方法耗時(shí)的方法、裝置及存儲(chǔ)介質(zhì)
- 函數(shù)的執(zhí)行方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)





