[發明專利]一種音頻高潮識別方法和裝置有效
| 申請號: | 201711312229.9 | 申請日: | 2017-12-07 |
| 公開(公告)號: | CN110019922B | 公開(公告)日: | 2021-06-15 |
| 發明(設計)人: | 高超;馬哲 | 申請(專利權)人: | 北京雷石天地電子技術有限公司 |
| 主分類號: | G06F16/63 | 分類號: | G06F16/63 |
| 代理公司: | 北京城烽知識產權代理事務所(特殊普通合伙) 11829 | 代理人: | 王新月 |
| 地址: | 100101 北京市*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 音頻 高潮 識別 方法 裝置 | ||
本發明實施例提供了一種音頻高潮識別方法和裝置。該方法包括:將目標歌曲的詞進行分詞,標記高頻詞語出現的時間段為高頻詞時段;將所述目標歌曲的曲切割為等時長的多個切片;分別對每一切片進行快速傅里葉變換,得到所述每一切片的頻域能量最高值;按時序順次連接所述每一切片的頻域能量最高值,得到切片的頻域能量最高值在時間上的切片函數曲線;將所述高頻詞時段與所述切片函數曲線的波峰段重合的時段作為高潮時段。該方法和裝置精確度高,適用范圍廣泛,節省大量人力資源。
技術領域
本發明涉及歌曲音頻處理領域,特別涉及卡拉OK高潮部分的識別方法和裝置。
背景技術
現有技術中識別歌曲的高潮部分所用的方法大多是根據歌詞進行查找,由于歌曲的高潮部分普遍存在重唱的情況,通過這種方法定位到歌曲的高潮部分。
在實現本發明過程中,發明人發現現有技術中至少存在如下問題:現有技術的歌曲高潮部分識別方法的查找范圍很有限,現有技術的歌曲高潮部分的識別方法的精確度低,適用范圍小,識別到的高潮部分難以進行其他操作,如歌曲串燒制作等。現有技術的歌曲高潮識別方法費事費力,而且由于歌詞中包含大量常用詞匯,高頻詞匯的篩選結果需要人力的二次識別,耗費大量資源。
發明內容
本發明實施例提供一種音頻高潮識別方法和裝置,該技術基于歌曲的頻域能量分析識別歌曲高潮的方法和裝置,可以適用于所有歌曲、樂曲,適用范圍廣泛,克服上述現有的歌曲高潮部分的定位方法精確度低,適用范圍小的缺陷。
為達到上述目的,本發明實施例一方面提供一種音頻高潮識別方法,包括:
將目標歌曲的詞進行分詞,標記高頻詞語出現的時間段為高頻詞時段;
將所述目標歌曲的曲切割為等時長的多個切片;
分別對每一切片進行快速傅里葉變換,得到所述每一切片的頻域能量最高值;
按時序順次連接所述每一切片的頻域能量最高值,得到切片的頻域能量最高值在時間上的切片函數曲線;
將所述高頻詞時段與所述切片函數曲線的波峰段重合的時段作為高潮時段。
可選的,所述將目標歌曲的詞進行分詞,標記高頻詞語出現的時間段為高頻詞時段包括:
提取所述目標歌曲的詞;
對所述目標歌曲的詞進行分詞,并統計其中重復頻率達到預設閾值的詞為高頻詞;
將所述高頻詞與其對應的時間進行匹配,得到高頻詞時段。
可選的,所述將所述目標歌曲的曲切割為等時長的多個切片,包括:
獲取所述目標歌曲的曲的1/4拍的時長;
以該1/4拍的時長或其倍數作為切割的時間單位,將所述目標歌曲的曲切割為等時長的多個切片。
可選的,所述按時序順次連接所述每一切片的頻域能量最高值,得到切片的頻域能量最高值在時間上的切片函數曲線,包括:
建立橫軸為時間,縱軸為頻域能量值的直角坐標系;其中,所述時間的原點為所述目標歌曲的時間起始點;
將每個切片的頻域能量最高值作為縱坐標,將切片對應時間段的中間值作為橫坐標,標記到所述直角坐標系;
用平滑曲線將每個切片對應的坐標點連接起來,得到切片的頻域能量最高值在時間上的切片函數曲線。
可選的,所述將所述高頻詞時段與所述切片函數曲線的波峰段重合的時段作為高潮時段包括:
將所述高頻詞時段標記到所述直角坐標系的橫軸上;
當以波峰作為中心點的波長λ超過預設波長閾值時,標記該相位標記為波峰段;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京雷石天地電子技術有限公司,未經北京雷石天地電子技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201711312229.9/2.html,轉載請聲明來源鉆瓜專利網。





