[發(fā)明專(zhuān)利]語(yǔ)音分類(lèi)方法、裝置及計(jì)算機(jī)存儲(chǔ)介質(zhì)在審
| 申請(qǐng)?zhí)枺?/td> | 201910716117.2 | 申請(qǐng)日: | 2019-08-05 |
| 公開(kāi)(公告)號(hào): | CN111128229A | 公開(kāi)(公告)日: | 2020-05-08 |
| 發(fā)明(設(shè)計(jì))人: | 肖萌萌;徐志京 | 申請(qǐng)(專(zhuān)利權(quán))人: | 上海海事大學(xué) |
| 主分類(lèi)號(hào): | G10L25/18 | 分類(lèi)號(hào): | G10L25/18;G10L25/24;G10L25/51;G10L15/00;G10L15/08 |
| 代理公司: | 上海互順專(zhuān)利代理事務(wù)所(普通合伙) 31332 | 代理人: | 成秋麗 |
| 地址: | 201306 上海市*** | 國(guó)省代碼: | 上海;31 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 語(yǔ)音 分類(lèi) 方法 裝置 計(jì)算機(jī) 存儲(chǔ) 介質(zhì) | ||
本發(fā)明提供一種語(yǔ)音分類(lèi)方法,方法包括:通過(guò)對(duì)待處理語(yǔ)音信號(hào)進(jìn)行預(yù)處理,獲得預(yù)處理語(yǔ)音信號(hào)所對(duì)應(yīng)的梅爾頻率倒譜系數(shù)、梅爾頻率倒譜系數(shù)所對(duì)應(yīng)的MFCC一階差分、MFCC二階差分;將梅爾頻率倒譜系數(shù)、梅爾頻率倒譜系數(shù)所對(duì)應(yīng)的MFCC一階差分、MFCC二階差分進(jìn)行組合,獲得特征參數(shù);采用主成分分析對(duì)提取的特征參數(shù)進(jìn)行降維,獲得降維后特征參數(shù);采用DAG?DBN,對(duì)所述降維后特征參數(shù)進(jìn)行訓(xùn)練及測(cè)試。此外,本發(fā)明還公開(kāi)了一種語(yǔ)音分類(lèi)裝置及計(jì)算機(jī)存儲(chǔ)介質(zhì)。
技術(shù)領(lǐng)域
本發(fā)明涉及音頻處理技術(shù)領(lǐng)域,特別是涉及一種語(yǔ)音分類(lèi)方法、裝置及計(jì)算機(jī)存儲(chǔ)介質(zhì)。
背景技術(shù)
帶有口音的語(yǔ)言交流會(huì)產(chǎn)生交流誤區(qū),尤其是人機(jī)溝通帶來(lái)了錯(cuò)誤的理解,因此需要客服口音帶來(lái)的障礙。
口音識(shí)別的關(guān)鍵點(diǎn)之一是進(jìn)行特征值提取,特征參數(shù)要能夠反映語(yǔ)音信息。在之前人們對(duì)線(xiàn)性預(yù)測(cè)倒譜系數(shù)(Linear Predictive Cepstrum Coefficients,簡(jiǎn)稱(chēng)LPCC)、線(xiàn)性預(yù)測(cè)系數(shù)(Linear Predictive Coefficients,簡(jiǎn)稱(chēng)LPC)以及梅爾頻率倒譜系數(shù)(MelFrequency Cepstrum Coefficient,簡(jiǎn)稱(chēng)MFCC)等進(jìn)行了深入的研究。MFCC更接近人耳的聽(tīng)覺(jué)特性以及具有較強(qiáng)的抗噪性等優(yōu)勢(shì)被廣泛使用,但是標(biāo)準(zhǔn)的MFCC僅僅可以體現(xiàn)出語(yǔ)音參數(shù)的靜態(tài)特性。
因此,現(xiàn)有技術(shù)中僅僅體現(xiàn)語(yǔ)音參數(shù)的靜態(tài)特性無(wú)法起到對(duì)語(yǔ)音的正確認(rèn)知,不能正確的對(duì)語(yǔ)音進(jìn)行分類(lèi)。
發(fā)明內(nèi)容
鑒于以上所述現(xiàn)有技術(shù)的缺點(diǎn),本發(fā)明的目的在于提供一種語(yǔ)音分類(lèi)方法及裝置,旨在通過(guò)同時(shí)反映語(yǔ)音的靜態(tài)特征和動(dòng)態(tài)特征,能夠保留用戶(hù)聲音特征,所以能夠提高分類(lèi)性能。
為實(shí)現(xiàn)上述目的及其他相關(guān)目的,本發(fā)明提供一種語(yǔ)音分類(lèi)方法,所述方法包括:
通過(guò)對(duì)待處理語(yǔ)音信號(hào)進(jìn)行預(yù)處理,獲得預(yù)處理語(yǔ)音信號(hào)所對(duì)應(yīng)的梅爾頻率倒譜系數(shù)、梅爾頻率倒譜系數(shù)所對(duì)應(yīng)的MFCC一階差分、MFCC二階差分;
將梅爾頻率倒譜系數(shù)、梅爾頻率倒譜系數(shù)所對(duì)應(yīng)的MFCC一階差分、MFCC二階差分進(jìn)行組合,獲得特征參數(shù);
采用主成分分析對(duì)提取的特征參數(shù)進(jìn)行降維,獲得降維后特征參數(shù);
采用DAG-DBN,對(duì)所述降維后特征參數(shù)進(jìn)行訓(xùn)練及測(cè)試。
一種實(shí)現(xiàn)方式中,所述通過(guò)對(duì)待處理語(yǔ)音信號(hào)進(jìn)行預(yù)處理,獲得預(yù)處理語(yǔ)音信號(hào)所對(duì)應(yīng)的梅爾頻率倒譜系數(shù)、梅爾頻率倒譜系數(shù)所對(duì)應(yīng)的MFCC一階差分、MFCC二階差分的步驟,包括:
將所述待處理語(yǔ)音信號(hào)通過(guò)高通濾波器進(jìn)行濾波;
將濾波后的語(yǔ)音信號(hào)進(jìn)行分幀處理;
將每一幀信號(hào)乘以漢明窗,獲得第一信號(hào);
將所述第一信號(hào)進(jìn)行快速傅里葉變換,得到第二信號(hào);
將所述第二信號(hào)通過(guò)三角帶通濾波器進(jìn)行濾波,獲得第三信號(hào);
對(duì)所述第三信號(hào)進(jìn)行離散余弦變換,獲得梅爾頻率倒譜系數(shù);
對(duì)所述梅爾頻率倒譜系數(shù)進(jìn)行一階差分變換,獲得MFCC一階差分;
對(duì)所述梅爾頻率倒譜系數(shù)進(jìn)行二階差分變換,獲得MFCC二階差分。
一種實(shí)現(xiàn)方式中,所述將濾波后的語(yǔ)音信號(hào)進(jìn)行分幀處理的步驟,包括:
將所述濾波后的語(yǔ)音信號(hào)進(jìn)行采樣,以獲取第一數(shù)量個(gè)采樣點(diǎn);
以所述第一數(shù)量個(gè)采樣點(diǎn)為一幀;且在相鄰兩幀之間重疊區(qū)域。
該專(zhuān)利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專(zhuān)利權(quán)人授權(quán)。該專(zhuān)利全部權(quán)利屬于上海海事大學(xué),未經(jīng)上海海事大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買(mǎi)此專(zhuān)利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910716117.2/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專(zhuān)利網(wǎng)。
- 用于語(yǔ)音處理的方法與系統(tǒng)
- 一種語(yǔ)音識(shí)別測(cè)試系統(tǒng)及方法
- 用于語(yǔ)音識(shí)別的方法和裝置
- 一種語(yǔ)音消毒柜的控制方法及語(yǔ)音消毒柜
- 一種語(yǔ)音處理方法及裝置
- 混合語(yǔ)音識(shí)別方法、裝置及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)
- 語(yǔ)音情緒識(shí)別方法、系統(tǒng)、移動(dòng)終端及存儲(chǔ)介質(zhì)
- 一種具有語(yǔ)音識(shí)別功能的智能語(yǔ)音終端設(shè)備
- 語(yǔ)音增強(qiáng)方法、裝置、電子設(shè)備和存儲(chǔ)介質(zhì)
- 一種聲紋鑒定語(yǔ)音重組方法和系統(tǒng)
- 數(shù)據(jù)分類(lèi)的方法和裝置
- 一種圖像分類(lèi)方法及裝置
- 報(bào)文分類(lèi)方法及網(wǎng)絡(luò)設(shè)備
- 一種短文本多標(biāo)簽分類(lèi)方法及裝置
- 一種高正確率的自然語(yǔ)言分類(lèi)器系統(tǒng)
- 多分類(lèi)模型優(yōu)化方法、裝置、存儲(chǔ)介質(zhì)及電子設(shè)備
- 一種回收部件的分類(lèi)回收箱和分類(lèi)驗(yàn)收裝置
- 一種回收部件的分類(lèi)回收箱和分類(lèi)驗(yàn)收裝置
- 一種基于神經(jīng)網(wǎng)絡(luò)的文本分類(lèi)方法和裝置
- 一種塑料大小分類(lèi)機(jī)
- 一種數(shù)據(jù)庫(kù)讀寫(xiě)分離的方法和裝置
- 一種手機(jī)動(dòng)漫人物及背景創(chuàng)作方法
- 一種通訊綜合測(cè)試終端的測(cè)試方法
- 一種服裝用人體測(cè)量基準(zhǔn)點(diǎn)的獲取方法
- 系統(tǒng)升級(jí)方法及裝置
- 用于虛擬和接口方法調(diào)用的裝置和方法
- 線(xiàn)程狀態(tài)監(jiān)控方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)
- 一種JAVA智能卡及其虛擬機(jī)組件優(yōu)化方法
- 檢測(cè)程序中方法耗時(shí)的方法、裝置及存儲(chǔ)介質(zhì)
- 函數(shù)的執(zhí)行方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 光源裝置、照明裝置、液晶裝置和電子裝置
- 預(yù)測(cè)裝置、編輯裝置、逆預(yù)測(cè)裝置、解碼裝置及運(yùn)算裝置
- 圖像形成裝置、定影裝置、遮光裝置以及保持裝置
- 打印裝置、讀取裝置、復(fù)合裝置以及打印裝置、讀取裝置、復(fù)合裝置的控制方法
- 電子裝置、光盤(pán)裝置、顯示裝置和攝像裝置
- 光源裝置、照明裝置、曝光裝置和裝置制造方法
- 用戶(hù)裝置、裝置對(duì)裝置用戶(hù)裝置、后端裝置及其定位方法
- 遙控裝置、通信裝置、可變裝置及照明裝置
- 透鏡裝置、攝像裝置、處理裝置和相機(jī)裝置
- 抖動(dòng)校正裝置、驅(qū)動(dòng)裝置、成像裝置、和電子裝置





