[發(fā)明專利]一種音頻豎線波形圖的生成方法有效
| 申請(qǐng)?zhí)枺?/td> | 201810163270.2 | 申請(qǐng)日: | 2018-02-27 |
| 公開(kāi)(公告)號(hào): | CN108399921B | 公開(kāi)(公告)日: | 2021-09-24 |
| 發(fā)明(設(shè)計(jì))人: | 郭艷杰 | 申請(qǐng)(專利權(quán))人: | 北京酷我科技有限公司 |
| 主分類號(hào): | G10L19/00 | 分類號(hào): | G10L19/00;G10L19/16 |
| 代理公司: | 北京國(guó)標(biāo)律師事務(wù)所 11753 | 代理人: | 姚克楓 |
| 地址: | 100080 北京市海淀區(qū)農(nóng)大*** | 國(guó)省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說(shuō)明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 音頻 豎線 波形 生成 方法 | ||
本發(fā)明涉及一種音頻豎線波形圖的生成方法,步驟如下:創(chuàng)建AVAsset對(duì)象,讀取音頻文件中的音軌AudioTrack,ASBD數(shù)據(jù)結(jié)構(gòu),得到音頻文件描述信息,獲取聲道數(shù)和采樣率,將音頻總時(shí)間轉(zhuǎn)換為總幀數(shù),得到總采樣幀數(shù),將總采樣幀數(shù)除以波形圖寬度像素?cái)?shù),得到每像素需要展現(xiàn)的幀數(shù),生豎線線條時(shí),首先建立寬度像素值個(gè)數(shù)的矩形區(qū)域Layer,然后按每像素一個(gè)Layer排列,最后對(duì)音頻數(shù)據(jù)進(jìn)行格式化,設(shè)定矩形區(qū)域Layer的高度。本發(fā)明,獲取音頻后,將波形圖每像素和音頻的幀數(shù)相對(duì)應(yīng),根據(jù)音頻數(shù)據(jù)格式化的形成波形圖的像素,處理速度快,圖形準(zhǔn)確性好,系統(tǒng)開(kāi)銷較佳,可作為波形圖標(biāo)準(zhǔn)生成模塊供其他功能調(diào)用,易于后期維護(hù)及使用。
技術(shù)領(lǐng)域
本發(fā)明涉及波形圖繪制技術(shù)領(lǐng)域,具體說(shuō)是一種音頻豎線波形圖的生成方法。
背景技術(shù)
聲波是一種縱波,來(lái)回振動(dòng)導(dǎo)致空氣分子產(chǎn)生疏密相間的排列。但是這種二維空間的方式非常不便于表示聲音的屬性,于是我們?nèi)∪我庖粋€(gè)點(diǎn),測(cè)量這個(gè)點(diǎn)的氣壓隨時(shí)間的變化,這樣就變成了橫軸為時(shí)間,縱軸為壓力變化的圖像。氣壓距離標(biāo)準(zhǔn)值偏差越大,說(shuō)明振動(dòng)越劇烈,響度越大,所以振幅越大的波形表示聲音越大。波形越緊密說(shuō)明單位時(shí)間內(nèi)振動(dòng)的次數(shù)越多,頻率越高,音高越高。
但是這樣有個(gè)問(wèn)題,就是對(duì)于單頻率的振動(dòng),可以很容易表示出來(lái),而我們聽(tīng)到的聲音往往是很復(fù)雜的頻率的疊加。因?yàn)楦鱾€(gè)頻率的波形都疊在一起了,就像把很多個(gè)周期振幅相位都不等的三角函數(shù)圖像加在一起,導(dǎo)致波形圖難以直觀的看出有用的信息。此時(shí),我們就需要頻譜來(lái)幫忙了。頻譜通過(guò)對(duì)波形的傅里葉變換,把波形中的每個(gè)頻率拆開(kāi)來(lái),再在縱軸上展開(kāi),越往上頻率越高。頻譜是三維的,越亮表示在這個(gè)頻率上越響,越暗表示越弱。所以頻譜相對(duì)于波形圖,是包含有更多信息的,唯一的缺點(diǎn)就是無(wú)法表示整體音量總和的大小,所以一般和波形配合觀看。
綜上,波形是將聲音的振幅圖形化,頻譜是將聲音的頻率圖形化。
波形聲音設(shè)備(例如麥克風(fēng))可以捕捉聲音,并將其轉(zhuǎn)換為數(shù)值,然后把它們儲(chǔ)存到內(nèi)存或者磁盤中形成波形文件,波形文件的擴(kuò)展名是.WAV。這樣,聲音就可以播放了。波形文件是數(shù)字化的波形聲音,是一種使用二進(jìn)制表示的串行比特流,它遵循一定的標(biāo)準(zhǔn)或者規(guī)范編碼,其數(shù)據(jù)是按時(shí)間順序組織的。
采樣的位數(shù)指的是描述數(shù)字信號(hào)所使用的位數(shù)。8位(8bit)代表2的8次方=256,16位(16bit)則代表2的16次方=65536/1024=64K。
采樣率(采樣頻率)是一秒鐘內(nèi)對(duì)聲音信號(hào)的采樣次數(shù),采樣率越高聲音音質(zhì)理論就越真實(shí),音頻文件(波形文件)就越大。
我們可以根據(jù)波形文件的頭信息獲取他的采樣,然后從錄音緩存區(qū)中隨著時(shí)間順序去讀取對(duì)應(yīng)的一個(gè)數(shù)值,然后通過(guò)這個(gè)數(shù)值去繪制對(duì)應(yīng)的波形圖,但目前沒(méi)有相應(yīng)的具體算法被公開(kāi)。
波形文件的頭信息即wav格式的音頻數(shù)據(jù)的頭部信息基本上是固定不變的,總共44個(gè)字節(jié),包括以下內(nèi)容:
1.RIFF(4個(gè)字節(jié))
固定字符串,RIFF是英文Resource Interchange File Format的縮寫
2.錄音數(shù)據(jù)長(zhǎng)度 +(44 -8) (4個(gè)字節(jié))
類型可以是int或long,但必須保證類型占4個(gè)字節(jié)大小
3.WAVE (4個(gè)字節(jié))
固定字符串,表示是wav文件
4.fmt (4個(gè)字節(jié))
固定字符串,注意最后有一個(gè)空格
5.size1(4個(gè)字節(jié))
值為16,如果為18則最后多了2個(gè)字節(jié)的附加信息
6.format tag(2個(gè)字節(jié))
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于北京酷我科技有限公司,未經(jīng)北京酷我科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810163270.2/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G10L 語(yǔ)音分析或合成;語(yǔ)音識(shí)別;音頻分析或處理
G10L19-00 用于冗余度下降情形
G10L19-02 .利用頻譜分析,例如變換聲碼器或子頻帶聲碼器
G10L19-04 .利用預(yù)測(cè)技術(shù)
G10L19-06 ..例如短期預(yù)測(cè)系數(shù)的頻譜特征的確定或編碼
G10L19-08 ..激勵(lì)函數(shù)的確定或編碼;長(zhǎng)期預(yù)測(cè)參數(shù)的確定或編碼
G10L19-14 ..不包括在G10L 19/06至G10L 19/12組中的零部件,例如增益編碼、后置濾波設(shè)計(jì)或聲碼器結(jié)構(gòu)
- 自動(dòng)配置藍(lán)牙A2DP傳輸音頻編碼格式的方法和系統(tǒng)
- 一種多路音頻處理方法、音頻播放終端及音頻接收裝置
- 一種音頻處理方法、裝置及終端設(shè)備
- 一種音頻質(zhì)量的檢測(cè)方法、裝置、電子設(shè)備及存儲(chǔ)介質(zhì)
- 音頻分離方法、裝置、設(shè)備及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)
- 一種音頻播放方法、裝置、以及計(jì)算機(jī)存儲(chǔ)介質(zhì)
- 一種音頻錄制系統(tǒng)
- 一種音頻共享系統(tǒng)及方法
- 音頻樣本生成方法、裝置、計(jì)算機(jī)設(shè)備及存儲(chǔ)介質(zhì)
- 音頻處理方法和裝置





