[發(fā)明專利]一種基于語(yǔ)調(diào)識(shí)別情緒的方法在審
| 申請(qǐng)?zhí)枺?/td> | 202010632183.4 | 申請(qǐng)日: | 2020-07-02 |
| 公開(公告)號(hào): | CN113889148A | 公開(公告)日: | 2022-01-04 |
| 發(fā)明(設(shè)計(jì))人: | 范芳芳;劉北辰;劉運(yùn)江;張香梅;趙繼東;李兵 | 申請(qǐng)(專利權(quán))人: | 正定仁運(yùn)誠(chéng)醫(yī)藥科技有限責(zé)任公司 |
| 主分類號(hào): | G10L25/63 | 分類號(hào): | G10L25/63;G10L25/24 |
| 代理公司: | 暫無(wú)信息 | 代理人: | 暫無(wú)信息 |
| 地址: | 050800 河北省石家莊市中國(guó)(河北)自由*** | 國(guó)省代碼: | 河北;13 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 語(yǔ)調(diào) 識(shí)別 情緒 方法 | ||
1.一種基于語(yǔ)調(diào)識(shí)別情緒的方法,其特征在于:包括以下步驟:
步驟a:在安靜的環(huán)境下,采用錄音的方式,由一名專業(yè)播音員分別用高興、難過、生氣、害怕四種語(yǔ)調(diào)朗讀并錄制測(cè)試句;
步驟b:通過不同試聽者對(duì)錄制的測(cè)試句進(jìn)行聽辨,并判斷測(cè)試句所包含的情緒,然后計(jì)算試聽者對(duì)各句子識(shí)別的正確率,從中挑選正確率高于95%的測(cè)試句作為聲音數(shù)據(jù);
步驟c:通過spss16.0軟件對(duì)聲音數(shù)據(jù)進(jìn)行統(tǒng)計(jì)處理;
步驟d:對(duì)處理后的聲音數(shù)據(jù)進(jìn)行分幀處理,將音頻分解為幀,對(duì)于每一幀,計(jì)算周期功率譜,將mel濾波器應(yīng)用到功率譜中,計(jì)算每個(gè)濾波器的能量和,計(jì)算能量的對(duì)數(shù)值,對(duì)每個(gè)對(duì)數(shù)能量進(jìn)行離散余弦變換,保留DCT的2-13個(gè)系數(shù),其余系數(shù)舍去;
步驟e:將分幀處理后的聲音數(shù)據(jù)特征分類編入語(yǔ)音數(shù)據(jù)庫(kù);
步驟f:麥克風(fēng)的采集輸入的語(yǔ)音信息,對(duì)語(yǔ)音信息進(jìn)行特征提取,然后對(duì)比語(yǔ)音數(shù)據(jù)庫(kù)內(nèi)聲音數(shù)據(jù),從而識(shí)別情緒。
2.根據(jù)權(quán)利要求1所述的一種基于語(yǔ)調(diào)識(shí)別情緒的方法,其特征在于:所述步驟a測(cè)試句可以為易理解的動(dòng)作關(guān)系句,描述關(guān)系句和事實(shí)關(guān)系句,句型為陳述句,句子內(nèi)容帶有情緒。
3.根據(jù)權(quán)利要求1所述的一種基于語(yǔ)調(diào)識(shí)別情緒的方法,其特征在于:所述步驟b中試聽者為不同年齡段健聽的學(xué)生,且學(xué)生中男女比例相同。
4.根據(jù)權(quán)利要求1所述的一種基于語(yǔ)調(diào)識(shí)別情緒的方法,其特征在于:所述步驟d信號(hào)每一幀的長(zhǎng)度為25ms,幀移為10ms,每一幀的周期功率譜,它隨聲音的大小而發(fā)生不同頻率的振動(dòng),通過耳鍋的不同位置上的振動(dòng),不同的神經(jīng)元將會(huì)通知大腦現(xiàn)在聽到的音頻頻率,通過mel濾波器確定不同頻率存在的能量,濾波器通常有交疊,因此濾波器能量彼此相關(guān),DCT對(duì)能量進(jìn)行去相關(guān),協(xié)方差的對(duì)角矩陣可以用來對(duì)HMM分類器進(jìn)行建模。
5.根據(jù)權(quán)利要求1所述的一種基于語(yǔ)調(diào)識(shí)別情緒的方法,其特征在于:所述分幀處理的實(shí)施步驟為:(1)將信號(hào)每一幀的長(zhǎng)度為25ms,幀移為10ms,信號(hào)為16KHz,共有0.025*16000=400個(gè)樣本,幀的間隔通常為10ms,即160個(gè)樣本,即第一幀400個(gè)樣本從樣本0開始,第二幀400個(gè)樣本從樣本160開始,幀之間具有交疊部分,直到達(dá)到語(yǔ)音結(jié)尾為止,如果語(yǔ)音不能劃分成偶數(shù)個(gè)幀,用0填滿它;然后對(duì)每個(gè)單一幀進(jìn)行提取12個(gè)MFCC系數(shù),約定為時(shí)域信號(hào),為第i幀的時(shí)域型號(hào),n的取值為1-400,計(jì)算復(fù)數(shù)離散傅立葉變換,得到,i表示第i幀,是第i幀的功率譜;(2)為了計(jì)算每一幀的DFT,執(zhí)行下面的運(yùn)算:其中,h(n)為樣本分析的漢明窗,K是DFT的長(zhǎng)度,接下來每一幀的功率譜估計(jì)即是功率譜的周期圖估計(jì),進(jìn)行512個(gè)點(diǎn)的FFT,只保留開始的257個(gè)系數(shù);(3)將26個(gè)三角形濾波器應(yīng)用到功率譜上,濾波器有26個(gè)向量組成,每個(gè)向量元素個(gè)數(shù)為257,每個(gè)向量大部分為0,但是有一部分頻率的值非零,為了計(jì)算濾波器的能量,把每一個(gè)濾波器與功率譜進(jìn)行相乘,然后系數(shù)相加,得出26個(gè)數(shù)值,它們代表每一個(gè)濾波器上面的能量;(4)然后分別計(jì)算26個(gè)能量的對(duì)數(shù)值;(5)對(duì)26個(gè)對(duì)數(shù)能量進(jìn)行DCT,得到26個(gè)系數(shù),取前12個(gè)系數(shù),每一幀得到的12個(gè)數(shù)即梅爾頻率倒譜系數(shù)。
6.根據(jù)權(quán)利要求1所述的一種基于語(yǔ)調(diào)識(shí)別情緒的方法,其特征在于:所述步驟f麥克風(fēng)采集的語(yǔ)音信息通過降噪處理后進(jìn)行采集,所述采集輸入的語(yǔ)音信息市場(chǎng)為2-6s。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于正定仁運(yùn)誠(chéng)醫(yī)藥科技有限責(zé)任公司,未經(jīng)正定仁運(yùn)誠(chéng)醫(yī)藥科技有限責(zé)任公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010632183.4/1.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 上一篇:一種油溶性植物提取物乳液
- 下一篇:一種融資租賃管理交互系統(tǒng)
- 語(yǔ)調(diào)生成方法、應(yīng)用該方法的語(yǔ)音合成裝置及語(yǔ)音服務(wù)器
- 預(yù)估語(yǔ)音信號(hào)的語(yǔ)調(diào)估測(cè)值的方法
- 基于語(yǔ)調(diào)模型的漢語(yǔ)語(yǔ)調(diào)基頻輪廓生成方法
- 一種調(diào)節(jié)手機(jī)客戶端程序播放語(yǔ)調(diào)的技術(shù)
- 一種移動(dòng)終端信息短語(yǔ)的調(diào)整方法、系統(tǒng)及移動(dòng)終端
- 一種確定目標(biāo)字符序列對(duì)應(yīng)的語(yǔ)調(diào)信息的方法與設(shè)備
- 情緒識(shí)別方法、設(shè)備及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)
- 一種語(yǔ)調(diào)檢測(cè)方法、裝置、設(shè)備及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)
- 語(yǔ)音識(shí)別方法及電子設(shè)備、計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)
- 客服語(yǔ)音評(píng)估方法、系統(tǒng)、設(shè)備及存儲(chǔ)介質(zhì)
- 識(shí)別媒體、識(shí)別媒體的識(shí)別方法、識(shí)別對(duì)象物品以及識(shí)別裝置
- 一種探針卡識(shí)別裝置和方法
- 識(shí)別裝置、識(shí)別方法以及記錄介質(zhì)
- 識(shí)別裝置、識(shí)別系統(tǒng),識(shí)別方法以及存儲(chǔ)介質(zhì)
- 識(shí)別程序、識(shí)別方法以及識(shí)別裝置
- 車載身份識(shí)別方法及系統(tǒng)
- 車載身份識(shí)別方法及系統(tǒng)
- 車載身份識(shí)別方法及系統(tǒng)
- 識(shí)別裝置、識(shí)別方法以及識(shí)別程序
- 識(shí)別裝置、識(shí)別方法及識(shí)別程序
- 股市情緒的確定方法和裝置
- 網(wǎng)絡(luò)情緒的確定方法和裝置
- 品牌情緒的確定方法和裝置
- 一種人臉情緒的識(shí)別方法和識(shí)別裝置、計(jì)算機(jī)可讀介質(zhì)
- 文本情緒呈現(xiàn)方法、文本情緒呈現(xiàn)裝置以及存儲(chǔ)介質(zhì)
- 一種智能工程師情緒監(jiān)測(cè)系統(tǒng)
- 基于深度學(xué)習(xí)和腦機(jī)接口的情緒識(shí)別系統(tǒng)及應(yīng)用
- 一種分析用戶對(duì)話情緒方法、系統(tǒng)、設(shè)備和存儲(chǔ)介質(zhì)
- 一種識(shí)別用戶情緒的方法及相關(guān)裝置
- 一種情緒監(jiān)測(cè)裝置及方法





