[發(fā)明專利]一種音頻可視化方法、裝置和存儲介質(zhì)在審
| 申請?zhí)枺?/td> | 202010549588.1 | 申請日: | 2020-06-16 |
| 公開(公告)號: | CN111782859A | 公開(公告)日: | 2020-10-16 |
| 發(fā)明(設(shè)計)人: | 閆震海 | 申請(專利權(quán))人: | 騰訊音樂娛樂科技(深圳)有限公司 |
| 主分類號: | G06F16/64 | 分類號: | G06F16/64;G06F16/68 |
| 代理公司: | 深圳翼盛智成知識產(chǎn)權(quán)事務所(普通合伙) 44300 | 代理人: | 李漢亮 |
| 地址: | 518000 廣東省深圳市*** | 國省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 音頻 可視化 方法 裝置 存儲 介質(zhì) | ||
本發(fā)明實施例公開了一種音頻可視化方法、裝置和存儲介質(zhì),其中,本發(fā)明通過確定音頻數(shù)據(jù)中的目標音頻幀,并獲取目標音頻幀的目標響度級,以及根據(jù)響度級和加權(quán)策略的預設(shè)對應關(guān)系,確定目標響度級對應的目標加權(quán)策略,然后,根據(jù)目標加權(quán)策略對目標音頻幀的頻域數(shù)據(jù)進行加權(quán)處理,得到加權(quán)后的頻域數(shù)據(jù),最后根據(jù)加權(quán)后的頻域數(shù)據(jù)生成目標音頻幀的頻譜圖像,并展示頻譜圖像。通過根據(jù)音頻作用于人耳的響度,采用不同的加權(quán)策略對音頻的頻域數(shù)據(jù)進行加權(quán)處理后進行可視化,最終可讓可視化效果更加靈活,且更符合人耳聽感。
技術(shù)領(lǐng)域
本發(fā)明涉及音頻處理技術(shù)領(lǐng)域,具體涉及一種音頻可視化方法、裝置和存儲介質(zhì)。
背景技術(shù)
隨著互聯(lián)網(wǎng)的普及,以及數(shù)字音頻的迅速流行,用戶可以通過手機、平板電腦等電子設(shè)備播放各種各樣的音頻數(shù)據(jù)(比如有聲小說、歌曲等)。
為了提高音頻數(shù)據(jù)播放過程中顯示信息的多樣性,相關(guān)技術(shù)中通過提取音頻數(shù)據(jù)的特征,并通過圖像渲染的方式,將音頻特征可視化的表示出來,從而達到畫面隨音頻數(shù)據(jù)的變化而變化的效果,即利用圖像語言來解釋音樂感受。
在對現(xiàn)有技術(shù)的研究和實踐過程中,本發(fā)明的發(fā)明人發(fā)現(xiàn),現(xiàn)有技術(shù)在進行音頻可視化處理的過程中,往往采用固定的可視化方式,不夠靈活。
發(fā)明內(nèi)容
本發(fā)明實施例提供一種音頻可視化方法、裝置和存儲介質(zhì),能夠更靈活的實現(xiàn)音頻可視化,且可視化效果更符合人耳聽感。
本發(fā)明實施例提供的音頻可視化方法,包括:
確定音頻數(shù)據(jù)中的目標音頻幀;
獲取所述目標音頻幀的目標響度級;
根據(jù)響度級和加權(quán)策略的預設(shè)對應關(guān)系,確定所述目標響度級對應的目標加權(quán)策略;
根據(jù)所述目標加權(quán)策略對所述目標音頻幀的頻域數(shù)據(jù)進行加權(quán)處理,得到加權(quán)后的頻域數(shù)據(jù);
根據(jù)所述加權(quán)后的頻域數(shù)據(jù)生成所述目標音頻幀的頻譜圖像,并展示所述頻譜圖像。
本發(fā)明實施例還提供一種音頻可視化裝置,包括:
目標確定模塊,用于確定音頻數(shù)據(jù)中的目標音頻幀;
響度獲取模塊,用于獲取所述目標音頻幀的目標響度級;
策略確定模塊,用于根據(jù)響度級和加權(quán)策略的預設(shè)對應關(guān)系,確定所述目標響度級對應的目標加權(quán)策略;
數(shù)據(jù)加權(quán)模塊,用于根據(jù)所述目標加權(quán)策略對所述目標音頻幀的頻域數(shù)據(jù)進行加權(quán)處理,得到加權(quán)后的頻域數(shù)據(jù);
圖像生成模塊,用于根據(jù)所述加權(quán)后的頻域數(shù)據(jù)生成所述目標音頻幀的頻譜圖像,并展示所述頻譜圖像。
此外,本發(fā)明實施例還提供一種存儲介質(zhì),所述存儲介質(zhì)存儲有計算機程序,所述計算機程序適于處理器進行加載,以執(zhí)行本發(fā)明實施例所提供的音頻可視化方法。
本發(fā)明通過確定音頻數(shù)據(jù)中的目標音頻幀,并獲取目標音頻幀的目標響度級,以及根據(jù)響度級和加權(quán)策略的預設(shè)對應關(guān)系,確定目標響度級對應的目標加權(quán)策略,然后,根據(jù)目標加權(quán)策略對目標音頻幀的頻域數(shù)據(jù)進行加權(quán)處理,得到加權(quán)后的頻域數(shù)據(jù),最后根據(jù)加權(quán)后的頻域數(shù)據(jù)生成目標音頻幀的頻譜圖像,并展示頻譜圖像。通過根據(jù)音頻作用于人耳的響度,采用不同的加權(quán)策略對音頻的頻域數(shù)據(jù)進行加權(quán)處理后進行可視化,最終可讓可視化效果更加靈活,且更符合人耳聽感。
附圖說明
為了更清楚地說明本發(fā)明實施例中的技術(shù)方案,下面將對實施例描述中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本發(fā)明的一些實施例,對于本領(lǐng)域普通技術(shù)人員來講,在不付出創(chuàng)造性勞動的前提下,還可以根據(jù)這些附圖獲得其他的附圖。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于騰訊音樂娛樂科技(深圳)有限公司,未經(jīng)騰訊音樂娛樂科技(深圳)有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010549588.1/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 數(shù)據(jù)可視化模型的處理方法及裝置
- 一種可視化內(nèi)容分發(fā)方法及系統(tǒng)
- 數(shù)據(jù)可視化圖形快速應用方法及系統(tǒng)
- 基于有效信息的流場可視化視圖量化方法
- 可視化報表的制作方法、裝置、終端設(shè)備及存儲介質(zhì)
- 一種可視化圖形快速應用與傳輸?shù)姆椒跋到y(tǒng)
- 一種可視化數(shù)據(jù)模型編排系統(tǒng)和編排方法
- 一種供水行業(yè)機房3D可視化運維管理系統(tǒng)
- 一種電網(wǎng)數(shù)據(jù)可視化方法、裝置、設(shè)備及介質(zhì)
- 一種大場景城市建筑實時三維可視化的方法





