[發明專利]音頻重音識別方法、裝置、設備和介質在審
| 申請號: | 202011172637.0 | 申請日: | 2020-10-28 |
| 公開(公告)號: | CN112259088A | 公開(公告)日: | 2021-01-22 |
| 發明(設計)人: | 鄭亞軍 | 申請(專利權)人: | 瑞聲新能源發展(常州)有限公司科教城分公司;瑞聲光電科技(常州)有限公司 |
| 主分類號: | G10L15/18 | 分類號: | G10L15/18;G10L25/27 |
| 代理公司: | 深圳中細軟知識產權代理有限公司 44528 | 代理人: | 田麗麗 |
| 地址: | 213167 江蘇省常州市武進*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 音頻 重音 識別 方法 裝置 設備 介質 | ||
本發明公開了一種音頻重音識別方法,該方法包括:獲取原始音頻信號;獲取目標高斯窗函數,根據目標高斯窗函數對原始音頻信號進行處理,得到原始音頻信號對應的能量變化曲線;獲取目標滑動窗,根據目標滑動窗確定能量變化曲線中的重音時刻,將在重音時刻的原始音頻信號標示為音頻重音。本發明充分考慮音頻信號在時間上的相關性,相較于傳統算法,后續重音識別的結果更為準確。同時本發明排除了音頻局部強度波動過大對整體音頻識別造成的影響,因此也更具科學性及實用性。此外,還提出了音頻重音識別裝置、設備和存儲介質。
技術領域
本發明涉及音頻處理技術領域,尤其是涉及音頻重音識別方法、裝置、設備和介質。
背景技術
不管是日常的說話交流、音樂影音、還是語音通話,都可以通過錄音將聲音保存為一段或多段音頻信號。音頻信號作為可保存的數據,是信息傳播的重要媒介。重音是音樂中強度較大的音,在聲音的沖擊上最為突出,是構成音樂節奏的主要因素,通過對音樂中的重音進行識別,可以判斷出音樂節奏的快慢。此外重音常常會包含一定的主觀情緒或者重點信息,通過對音頻中的重音進行識別,可因分辨出音頻中的主觀情緒和重點信息。因此可以說,對于音頻重音進行分析識別可以更加充分的了解該段音頻信號所要表達的含義。
發明內容
基于此,有必要針對上述問題,提供可準確識別的音頻重音識別方法、裝置、設備和介質。
一種音頻重音識別的方法,所述方法包括:
獲取原始音頻信號;
獲取目標高斯窗函數,根據所述目標高斯窗函數對所述原始音頻信號進行處理,得到所述原始音頻信號對應的能量變化曲線;
獲取目標滑動窗,根據所述目標滑動窗確定所述能量變化曲線中的重音時刻,將在所述重音時刻的所述原始音頻信號標示為音頻重音。
在其中一個實施例中,所述根據所述目標高斯窗函數對所述原始音頻信號進行處理,得到所述原始音頻信號對應的能量變化曲線,包括:
根據所述目標高斯函數對所述原始音頻信號進行加權計算,得到所述原始音頻信號對應的能量曲線;
對所述能量曲線進行數值轉換處理,得到所述原始音頻信號對應的能量變化曲線。
在其中一個實施例中,所述根據所述目標高斯函數對所述原始音頻信號進行加權計算,得到所述原始音頻信號對應的能量曲線,包括:
根據所述目標高斯窗函數確定所述原始音頻信號在目標時刻的截斷音頻信號;其中,所述目標時刻為所述原始音頻信號中的任意一個時刻;
將所述截斷音頻信號與所述目標高斯窗函數進行加權計算,獲取所述原始音頻信號在所述目標時刻的目標能量值,根據在每一目標時刻的所述目標能量值得到所述原始音頻信號對應的能量曲線。
在其中一個實施例中,所述根據所述目標高斯窗函數確定所述原始音頻信號在目標時刻的截斷音頻信號,包括:
以所述目標時刻為所述目標高斯窗函數對應的高斯窗口的中間時刻,在所述原始音頻信號上添加高斯窗口;
將所述高斯窗口內的音頻信號作為在所述目標時刻的截斷音頻信號。
在其中一個實施例中,所述對所述能量曲線進行數值轉換處理,得到所述原始音頻信號對應的能量變化曲線,包括:
對所述能量曲線進行取對數處理,獲取所述原始音頻信號對應的對數函數;
對所述對數函數進行二次求導處理,獲取所述原始音頻信號對應的能量變化曲線。
在其中一個實施例中,所述根據所述目標滑動窗確定所述能量變化曲線中的重音時刻,包括:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于瑞聲新能源發展(常州)有限公司科教城分公司;瑞聲光電科技(常州)有限公司,未經瑞聲新能源發展(常州)有限公司科教城分公司;瑞聲光電科技(常州)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011172637.0/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種創業培訓管理系統
- 下一篇:一種電熱綜合能源系統可行域構建方法





