[發(fā)明專(zhuān)利]基于語(yǔ)義細(xì)胞的語(yǔ)音情感識(shí)別方法有效
| 申請(qǐng)?zhí)枺?/td> | 201410402937.1 | 申請(qǐng)日: | 2014-08-15 |
| 公開(kāi)(公告)號(hào): | CN104200814B | 公開(kāi)(公告)日: | 2017-07-21 |
| 發(fā)明(設(shè)計(jì))人: | 孫凌云;何博偉;湯永川;李彥;鄭楷洪 | 申請(qǐng)(專(zhuān)利權(quán))人: | 浙江大學(xué) |
| 主分類(lèi)號(hào): | G10L25/63 | 分類(lèi)號(hào): | G10L25/63;G10L15/06 |
| 代理公司: | 杭州天勤知識(shí)產(chǎn)權(quán)代理有限公司33224 | 代理人: | 胡紅娟 |
| 地址: | 310027 浙*** | 國(guó)省代碼: | 浙江;33 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 基于 語(yǔ)義 細(xì)胞 語(yǔ)音 情感 識(shí)別 方法 | ||
技術(shù)領(lǐng)域
本發(fā)明涉及語(yǔ)音識(shí)別技術(shù)領(lǐng)域,具體涉及一種基于語(yǔ)義細(xì)胞的語(yǔ)音情感識(shí)別方法。
背景技術(shù)
語(yǔ)音是用來(lái)表示語(yǔ)言的聲音符號(hào),是人類(lèi)相互交流、傳遞情感的重要媒介之一。語(yǔ)音情感識(shí)別是情感計(jì)算領(lǐng)域的重要研究方向,其目標(biāo)是通過(guò)語(yǔ)音信號(hào)識(shí)別說(shuō)話(huà)者的情感狀態(tài),最終實(shí)現(xiàn)自然、友好、生動(dòng)的人機(jī)交互。
語(yǔ)音情感識(shí)別技術(shù)可用于交互式教學(xué)、智能車(chē)載系統(tǒng)、智能家電等諸多領(lǐng)域,如Schuller等研發(fā)的在線(xiàn)電影和計(jì)算機(jī)教程應(yīng)用程序中,系統(tǒng)根據(jù)檢測(cè)到的情感信息對(duì)用戶(hù)做出響應(yīng)(Schuller B,Rigoll G,Lang M.Speech emotion recognition combining acoustic features and linguistic information in a hybrid support vector machine-belief network architecture.//Acoustics,Speech,and Signal Processing,2004.Proceedings.(ICASSP'04).IEEE International Conference on.IEEE.Montreal,Canada,2004:1:I-577-80vol.1.);Jones等將語(yǔ)音情感識(shí)別技術(shù)用于車(chē)載系統(tǒng),合成與駕駛?cè)饲楦衅ヅ涞奶崾菊Z(yǔ)音以增強(qiáng)駕駛體驗(yàn)(見(jiàn):Jones C M,Jonsson M.Performance analysis of acoustic emotion recognition for in-car conversational interfaces//Universal Access in Human-Computer Interaction.Ambient Interaction.Springer.Heidelberg,Berlin,2007:411-420.)。
使用語(yǔ)音特征數(shù)據(jù)訓(xùn)練分類(lèi)器是目前語(yǔ)音情感識(shí)別系統(tǒng)的主要做法,如基于支持向量機(jī)(SVM)、人工神經(jīng)網(wǎng)絡(luò)(ANN)、隱馬爾可夫模型(HMM)、高斯混合模型(GMM)、k-近鄰(k-NN)、AdaBoost等。每種分類(lèi)器都有其優(yōu)缺點(diǎn),如GMM分類(lèi)器訓(xùn)練時(shí)間少,但對(duì)模型初始化參數(shù)敏感;SVM分類(lèi)器需要相對(duì)較長(zhǎng)時(shí)間的訓(xùn)練,但對(duì)模型初始值不敏感。
此外,由于傳統(tǒng)k-NN算法需要存儲(chǔ)所有的特征數(shù)據(jù),GMM算法需要存儲(chǔ)各維度各高斯分量的參數(shù),SVM算法需要存儲(chǔ)用于分割超平面的支持向量,直接導(dǎo)致識(shí)別模型需要的存儲(chǔ)空間大。
發(fā)明內(nèi)容
本發(fā)明利用語(yǔ)義細(xì)胞認(rèn)知結(jié)構(gòu)上的優(yōu)勢(shì),克服現(xiàn)有語(yǔ)音情感識(shí)別算法生成模型占用數(shù)據(jù)空間大的不足,且能保持與SVM算法相似的識(shí)別精準(zhǔn)度。
一種基于語(yǔ)義細(xì)胞的語(yǔ)音情感識(shí)別方法,包括:
(1)構(gòu)建語(yǔ)音庫(kù),所述語(yǔ)音庫(kù)中包括若干個(gè)語(yǔ)音參照人的若干條不同情感的語(yǔ)音信號(hào);
(2)針對(duì)語(yǔ)音庫(kù)中任意一條語(yǔ)音信號(hào),進(jìn)行預(yù)處理將當(dāng)前語(yǔ)音信號(hào)劃分為若干幀,并對(duì)每一幀進(jìn)行情感特征提取,根據(jù)提取結(jié)果計(jì)算當(dāng)前語(yǔ)音信號(hào)的特征向量;
(3)根據(jù)所述的特征向量,利用基于語(yǔ)義細(xì)胞的混合模型訓(xùn)練得到分類(lèi)器的識(shí)別模型;
(4)利用所述的識(shí)別模型識(shí)別待識(shí)別語(yǔ)音信號(hào)所屬的情感類(lèi)別。
語(yǔ)義細(xì)胞(Information Cell)理論由湯永川和Lawry J.共同提出(Tang Y,Lawry J.Information Cell Mixture Models:The Cognitive Representations of Vague Concepts//Integrated Uncertainty Management and Applications.Heidelberg,Berlin:Springer,2010:371-382.),其基礎(chǔ)是模糊計(jì)算和原型理論,主要思想是:概念并不由形式規(guī)則或映射來(lái)表示,而是由其原型來(lái)表示,概念范疇基于同原型的相似性來(lái)判定。語(yǔ)義細(xì)胞具有透明的認(rèn)知結(jié)構(gòu),符合人類(lèi)學(xué)習(xí)概念的認(rèn)知過(guò)程,具有堅(jiān)實(shí)的認(rèn)知心理學(xué)基礎(chǔ)與嚴(yán)格的數(shù)學(xué)定義,具備描述模糊概念的先天優(yōu)勢(shì)。語(yǔ)音情感識(shí)別是模糊概念領(lǐng)域中的典型問(wèn)題,語(yǔ)音中的情感分類(lèi)(如憤怒、驚奇等)是一種模糊概念,難以憑借具體規(guī)則進(jìn)行界定。而通過(guò)原型表達(dá)概念的語(yǔ)義細(xì)胞因?yàn)槠洳灰蕾?lài)具體分類(lèi)規(guī)則的特點(diǎn),適合于語(yǔ)音情感識(shí)別。因此,基于語(yǔ)義細(xì)胞的混合模型訓(xùn)練得到的分類(lèi)器能夠有效的提高分類(lèi)器的識(shí)別率。
該專(zhuān)利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專(zhuān)利權(quán)人授權(quán)。該專(zhuān)利全部權(quán)利屬于浙江大學(xué),未經(jīng)浙江大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買(mǎi)此專(zhuān)利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201410402937.1/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專(zhuān)利網(wǎng)。
- 上一篇:半導(dǎo)體器件
- 下一篇:一種不同音色的鑼
- 面向語(yǔ)義Web服務(wù)程序設(shè)計(jì)的語(yǔ)義數(shù)據(jù)表示和處理方法
- 一種基于語(yǔ)義的三維模型檢索系統(tǒng)和方法
- 一種計(jì)算機(jī)語(yǔ)義工程系統(tǒng)
- 導(dǎo)航方法及裝置
- 一種分層次多語(yǔ)義網(wǎng)系統(tǒng)及方法
- 一種基于上下文的語(yǔ)義匹配方法和系統(tǒng)
- 遠(yuǎn)程語(yǔ)義識(shí)別方法、裝置、設(shè)備及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)
- 一種基于語(yǔ)義依存關(guān)系的醫(yī)療文本標(biāo)注方法
- 基于多級(jí)語(yǔ)義表征和語(yǔ)義計(jì)算的信號(hào)語(yǔ)義識(shí)別方法
- 語(yǔ)義分類(lèi)方法及裝置、存儲(chǔ)介質(zhì)及電子設(shè)備
- 一種高效免疫活性細(xì)胞群制備及用于抗腫瘤的方法
- 獲得和使用內(nèi)胚層和肝細(xì)胞的組合物和方法
- bumetanide在抑制腫瘤細(xì)胞增殖中的應(yīng)用
- 細(xì)胞陣列計(jì)算系統(tǒng)以及其中細(xì)胞之間的通信方法
- 細(xì)胞陣列計(jì)算系統(tǒng)以及其中細(xì)胞間群發(fā)通信方法
- 獲得和使用內(nèi)胚層和肝細(xì)胞的組合物和方法
- 用于自動(dòng)生成遺傳修飾的T細(xì)胞的方法
- 細(xì)胞核圖像輪廓捕獲設(shè)備及其方法
- 細(xì)胞結(jié)構(gòu)體及細(xì)胞結(jié)構(gòu)體的制造方法
- 一種懸浮細(xì)胞培養(yǎng)中去除死細(xì)胞的方法
- 用于語(yǔ)音處理的方法與系統(tǒng)
- 一種語(yǔ)音識(shí)別測(cè)試系統(tǒng)及方法
- 用于語(yǔ)音識(shí)別的方法和裝置
- 一種語(yǔ)音消毒柜的控制方法及語(yǔ)音消毒柜
- 一種語(yǔ)音處理方法及裝置
- 混合語(yǔ)音識(shí)別方法、裝置及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)
- 語(yǔ)音情緒識(shí)別方法、系統(tǒng)、移動(dòng)終端及存儲(chǔ)介質(zhì)
- 一種具有語(yǔ)音識(shí)別功能的智能語(yǔ)音終端設(shè)備
- 語(yǔ)音增強(qiáng)方法、裝置、電子設(shè)備和存儲(chǔ)介質(zhì)
- 一種聲紋鑒定語(yǔ)音重組方法和系統(tǒng)





