[發(fā)明專(zhuān)利]音頻數(shù)據(jù)可視化方法及裝置有效
| 申請(qǐng)?zhí)枺?/td> | 201611183228.4 | 申請(qǐng)日: | 2016-12-20 |
| 公開(kāi)(公告)號(hào): | CN106649703B | 公開(kāi)(公告)日: | 2019-11-19 |
| 發(fā)明(設(shè)計(jì))人: | 謝旭榮;王嵐 | 申請(qǐng)(專(zhuān)利權(quán))人: | 中國(guó)科學(xué)院深圳先進(jìn)技術(shù)研究院 |
| 主分類(lèi)號(hào): | G06F16/783 | 分類(lèi)號(hào): | G06F16/783;G06F16/738 |
| 代理公司: | 44237 深圳中一專(zhuān)利商標(biāo)事務(wù)所 | 代理人: | 陽(yáng)開(kāi)亮<國(guó)際申請(qǐng)>=<國(guó)際公布>=<進(jìn)入 |
| 地址: | 518000 廣東省深圳*** | 國(guó)省代碼: | 廣東;44 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 音頻 數(shù)據(jù) 可視化 方法 裝置 | ||
1.一種音頻數(shù)據(jù)可視化方法,其特征在于,包括:
接收音頻數(shù)據(jù)并提取所述音頻數(shù)據(jù)的聲學(xué)特征;
通過(guò)情感分類(lèi)模型得出所述音頻數(shù)據(jù)的與所述聲學(xué)特征時(shí)序上對(duì)應(yīng)的情感特征,包括:通過(guò)基于隱馬爾科夫模型的情感分類(lèi)模型,計(jì)算所述音頻數(shù)據(jù)的每一可發(fā)射隱藏狀態(tài)的后驗(yàn)概率;將所述音頻數(shù)據(jù)的各個(gè)可發(fā)射隱藏狀態(tài)的后驗(yàn)概率形成特征向量,所述特征向量為所述音頻數(shù)據(jù)的情感特征;
通過(guò)模式特征生成模型生成所述音頻數(shù)據(jù)的與所述情感特征時(shí)序上對(duì)應(yīng)的模式特征,包括:對(duì)于所述音頻數(shù)據(jù)的情感特征,通過(guò)基于混合密度網(wǎng)絡(luò)的模式特征生成模型,確定所述音頻數(shù)據(jù)的高斯混合模型參數(shù);對(duì)所述高斯混合模型,通過(guò)最大似然參數(shù)生成算法生成模式特征;
通過(guò)預(yù)設(shè)數(shù)據(jù)庫(kù)獲取與所述模式特征對(duì)應(yīng)的預(yù)設(shè)可視化信息并展示,所述預(yù)設(shè)數(shù)據(jù)庫(kù)中存儲(chǔ)有多對(duì)一一對(duì)應(yīng)的模式特征和預(yù)設(shè)可視化信息。
2.根據(jù)權(quán)利要求1所述的音頻數(shù)據(jù)可視化方法,其特征在于,
在所述通過(guò)情感分類(lèi)模型獲取與所述聲學(xué)特征對(duì)應(yīng)的情感特征之前,還包括:
通過(guò)第一樣本數(shù)據(jù)對(duì)所述情感分類(lèi)模型進(jìn)行訓(xùn)練,確定所述情感分類(lèi)模型的參數(shù);所述情感分類(lèi)模型為基于隱馬爾科夫模型的情感分類(lèi)模型;所述第一樣本數(shù)據(jù)包括音頻段落的聲學(xué)特征和與所述音頻段落的聲學(xué)特征在時(shí)序上對(duì)應(yīng)的情感標(biāo)簽;
在所述通過(guò)模式特征生成模型生成與所述情感特征對(duì)應(yīng)的模式特征之前,還包括:
通過(guò)第二樣本數(shù)據(jù)對(duì)所述模式特征生成模型進(jìn)行訓(xùn)練,確定所述模式特征生成模型的參數(shù);所述模式特征生成模型為基于混合密度網(wǎng)絡(luò)的模式特征生成模型;所述第二樣本數(shù)據(jù)包括音頻段落的情感特征和與所述音頻段落的情感特征在時(shí)序上對(duì)應(yīng)的模式特征。
3.根據(jù)權(quán)利要求1或2的音頻數(shù)據(jù)可視化方法,其特征在于,所述提取所述音頻數(shù)據(jù)的聲學(xué)特征包括:
按照預(yù)設(shè)條件將所述音頻數(shù)據(jù)切分成多段子音頻數(shù)據(jù);所述預(yù)設(shè)條件包括預(yù)設(shè)時(shí)長(zhǎng)間隔;
對(duì)每段所述子音頻數(shù)據(jù)提取聲學(xué)特征。
4.一種音頻數(shù)據(jù)可視化裝置,其特征在于,包括:
聲學(xué)特征提取模塊,用于接收音頻數(shù)據(jù)并提取所述音頻數(shù)據(jù)的聲學(xué)特征;
情感特征獲取模塊,用于通過(guò)情感分類(lèi)模型得出與所述聲學(xué)特征時(shí)序上對(duì)應(yīng)的情感特征;
模式生成模塊,用于通過(guò)模式特征生成模型生成與所述情感特征時(shí)序上對(duì)應(yīng)的模式特征;
可視化模塊,用于通過(guò)預(yù)設(shè)數(shù)據(jù)庫(kù)獲取與所述模式特征對(duì)應(yīng)的預(yù)設(shè)可視化信息并展示;所述預(yù)設(shè)數(shù)據(jù)庫(kù)中存儲(chǔ)有多對(duì)一一對(duì)應(yīng)的模式特征和預(yù)設(shè)可視化信息;
所述情感特征獲取模塊包括:
計(jì)算單元,用于通過(guò)基于隱馬爾科夫模型的情感分類(lèi)模型,計(jì)算所述音頻數(shù)據(jù)的每一可發(fā)射隱藏狀態(tài)的后驗(yàn)概率;
情感特征生成單元,用于將所述音頻數(shù)據(jù)的各個(gè)可發(fā)射隱藏狀態(tài)的后驗(yàn)概率形成特征向量,所述特征向量為所述音頻數(shù)據(jù)的情感特征;
所述模式生成模塊包括:
參數(shù)確定單元,用于對(duì)于所述音頻數(shù)據(jù)的情感特征,通過(guò)基于混合密度網(wǎng)絡(luò)的模式特征生成模型,確定所述音頻數(shù)據(jù)的高斯混合模型參數(shù);
模式生成單元,用于對(duì)所述高斯混合模型,通過(guò)最大似然參數(shù)生成算法生成模式特征。
5.根據(jù)權(quán)利要求4所述的音頻數(shù)據(jù)可視化裝置,其特征在于,還包括:
情感分類(lèi)模型參數(shù)確定模塊,用于通過(guò)第一樣本數(shù)據(jù)對(duì)所述情感分類(lèi)模型進(jìn)行訓(xùn)練,確定所述情感分類(lèi)模型的參數(shù);所述情感分類(lèi)模型為基于隱馬爾科夫模型的情感分類(lèi)模型;所述第一樣本數(shù)據(jù)包括音頻段落的聲學(xué)特征和與所述音頻段落的聲學(xué)特征在時(shí)序上對(duì)應(yīng)的情感特征;
模式特征生成模型參數(shù)確定模塊,用于通過(guò)第二樣本數(shù)據(jù)對(duì)所述模式特征生成模型進(jìn)行訓(xùn)練,確定所述模式特征生成模型的參數(shù);所述模式特征生成模型為基于混合密度網(wǎng)絡(luò)的模式特征生成模型;所述第二樣本數(shù)據(jù)包括音頻段落的情感特征和與所述音頻段落的情感特征在時(shí)序上對(duì)應(yīng)的模式特征。
6.根據(jù)權(quán)利要求4或5的音頻數(shù)據(jù)可視化裝置,其特征在于,所述聲學(xué)特征提取模塊包括:
音頻切分單元,用于按照預(yù)設(shè)條件將所述音頻數(shù)據(jù)切分成多段子音頻數(shù)據(jù);所述預(yù)設(shè)條件包括預(yù)設(shè)時(shí)長(zhǎng)間隔;
聲學(xué)特征提取單元,用于對(duì)每段所述子音頻數(shù)據(jù)提取聲學(xué)特征。
該專(zhuān)利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專(zhuān)利權(quán)人授權(quán)。該專(zhuān)利全部權(quán)利屬于中國(guó)科學(xué)院深圳先進(jìn)技術(shù)研究院,未經(jīng)中國(guó)科學(xué)院深圳先進(jìn)技術(shù)研究院許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買(mǎi)此專(zhuān)利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201611183228.4/1.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專(zhuān)利網(wǎng)。
- 自動(dòng)配置藍(lán)牙A2DP傳輸音頻編碼格式的方法和系統(tǒng)
- 一種多路音頻處理方法、音頻播放終端及音頻接收裝置
- 一種音頻處理方法、裝置及終端設(shè)備
- 一種音頻質(zhì)量的檢測(cè)方法、裝置、電子設(shè)備及存儲(chǔ)介質(zhì)
- 音頻分離方法、裝置、設(shè)備及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)
- 一種音頻播放方法、裝置、以及計(jì)算機(jī)存儲(chǔ)介質(zhì)
- 一種音頻錄制系統(tǒng)
- 一種音頻共享系統(tǒng)及方法
- 音頻樣本生成方法、裝置、計(jì)算機(jī)設(shè)備及存儲(chǔ)介質(zhì)
- 音頻處理方法和裝置
- 數(shù)據(jù)顯示系統(tǒng)、數(shù)據(jù)中繼設(shè)備、數(shù)據(jù)中繼方法、數(shù)據(jù)系統(tǒng)、接收設(shè)備和數(shù)據(jù)讀取方法
- 數(shù)據(jù)記錄方法、數(shù)據(jù)記錄裝置、數(shù)據(jù)記錄媒體、數(shù)據(jù)重播方法和數(shù)據(jù)重播裝置
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)發(fā)送系統(tǒng)、數(shù)據(jù)發(fā)送裝置以及數(shù)據(jù)結(jié)構(gòu)
- 數(shù)據(jù)顯示系統(tǒng)、數(shù)據(jù)中繼設(shè)備、數(shù)據(jù)中繼方法及數(shù)據(jù)系統(tǒng)
- 數(shù)據(jù)嵌入裝置、數(shù)據(jù)嵌入方法、數(shù)據(jù)提取裝置及數(shù)據(jù)提取方法
- 數(shù)據(jù)管理裝置、數(shù)據(jù)編輯裝置、數(shù)據(jù)閱覽裝置、數(shù)據(jù)管理方法、數(shù)據(jù)編輯方法以及數(shù)據(jù)閱覽方法
- 數(shù)據(jù)發(fā)送和數(shù)據(jù)接收設(shè)備、數(shù)據(jù)發(fā)送和數(shù)據(jù)接收方法
- 數(shù)據(jù)發(fā)送裝置、數(shù)據(jù)接收裝置、數(shù)據(jù)收發(fā)系統(tǒng)、數(shù)據(jù)發(fā)送方法、數(shù)據(jù)接收方法和數(shù)據(jù)收發(fā)方法
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)再現(xiàn)方法、數(shù)據(jù)發(fā)送裝置及數(shù)據(jù)再現(xiàn)裝置
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)再現(xiàn)方法、數(shù)據(jù)發(fā)送裝置及數(shù)據(jù)再現(xiàn)裝置
- 數(shù)據(jù)可視化模型的處理方法及裝置
- 一種可視化內(nèi)容分發(fā)方法及系統(tǒng)
- 數(shù)據(jù)可視化圖形快速應(yīng)用方法及系統(tǒng)
- 基于有效信息的流場(chǎng)可視化視圖量化方法
- 可視化報(bào)表的制作方法、裝置、終端設(shè)備及存儲(chǔ)介質(zhì)
- 一種可視化圖形快速應(yīng)用與傳輸?shù)姆椒跋到y(tǒng)
- 一種可視化數(shù)據(jù)模型編排系統(tǒng)和編排方法
- 一種供水行業(yè)機(jī)房3D可視化運(yùn)維管理系統(tǒng)
- 一種電網(wǎng)數(shù)據(jù)可視化方法、裝置、設(shè)備及介質(zhì)
- 一種大場(chǎng)景城市建筑實(shí)時(shí)三維可視化的方法
- 一種數(shù)據(jù)庫(kù)讀寫(xiě)分離的方法和裝置
- 一種手機(jī)動(dòng)漫人物及背景創(chuàng)作方法
- 一種通訊綜合測(cè)試終端的測(cè)試方法
- 一種服裝用人體測(cè)量基準(zhǔn)點(diǎn)的獲取方法
- 系統(tǒng)升級(jí)方法及裝置
- 用于虛擬和接口方法調(diào)用的裝置和方法
- 線程狀態(tài)監(jiān)控方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)
- 一種JAVA智能卡及其虛擬機(jī)組件優(yōu)化方法
- 檢測(cè)程序中方法耗時(shí)的方法、裝置及存儲(chǔ)介質(zhì)
- 函數(shù)的執(zhí)行方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)





