[發明專利]樂曲識別方法、裝置、電子設備及計算機可讀存儲介質在審
| 申請號: | 202110887131.6 | 申請日: | 2021-08-03 |
| 公開(公告)號: | CN113593609A | 公開(公告)日: | 2021-11-02 |
| 發明(設計)人: | 潘頌聲;曹偲;朱一聞;劉華平;趙翔宇;李鵬 | 申請(專利權)人: | 杭州網易云音樂科技有限公司 |
| 主分類號: | G10L25/51 | 分類號: | G10L25/51;G10L25/27;G10L25/30;G06N3/04;G06N3/08;G06K9/62 |
| 代理公司: | 北京律智知識產權代理有限公司 11438 | 代理人: | 王輝;闞梓瑄 |
| 地址: | 310052 浙江省杭州市蕭山區錢江世*** | 國省代碼: | 浙江;33 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 樂曲 識別 方法 裝置 電子設備 計算機 可讀 存儲 介質 | ||
本公開提供一種樂曲識別方法、樂曲識別裝置、電子設備及計算機可讀存儲介質;涉及人工智能技術領域。該樂曲識別方法應用于包括音頻輸入裝置的終端設備,該方法包括:通過音頻輸入裝置接收用戶輸入的音頻;對音頻進行分析并確定音頻的面貌信息,面貌信息包括無效音頻、低信噪比音頻或高信噪比音頻;當面貌信息指示音頻為低信噪比音頻時,根據低信噪比識別策略對音頻進行識別,并輸出低信噪比識別結果;當面貌信息指示音頻為高信噪比音頻時,根據高信噪比識別策略對音頻進行識別,并輸出高信噪比識別結果;基于低信噪比識別結果或高信噪比識別結果確定所識別到的樂曲。本公開可以針對各種場景和音頻進行有效的識別,并輸出準確率較高的匹配結果。
技術領域
本公開涉及人工智能技術領域,具體而言,涉及基于人工智能技術的一種樂曲識別方法、樂曲識別裝置、電子設備及計算機可讀存儲介質。
背景技術
本部分旨在為權利要求書中陳述的本公開的實施方式提供背景或上下文。此處的描述不因為包括在本部分中就承認是現有技術。
伴隨著文娛需求的日益增長,越來越多的用戶試圖通過音頻片段來搜索心儀的樂曲。這種通過一段音頻來識別對應的樂曲的方式可以被稱為“聽聲識曲”。現有的用于聽聲識曲的主要方式可以包括:音頻指紋識別、翻唱識別和哼唱識別。然而,在單獨應用上述方式中的一種時,往往對于低信噪比的音頻無法進行有效識別,或者對于例如現場演奏或大幅度改編的歌曲無法進行有效識別,從而造成識別準確率下降、匹配到錯誤的識別結果等,嚴重影響用戶體驗。
因此,需要一種改進的樂曲識別方法和裝置,以至少能夠針對各種場景和音頻進行有效的識別,并輸出準確率較高的匹配結果。
發明內容
鑒于此,需要一種樂曲識別方案,能夠至少在一定程度上解決由低信噪比音頻或大幅度改編的歌曲所造成的單一一種聽聲識曲技術識別準確率不良、匹配到錯誤的樂曲的問題。
在本上下文中,本公開的實施方式期望提供一種樂曲識別方法、樂曲識別裝置、電子設備及計算機可讀存儲介質。
根據本公開的第一方面,提供了一種樂曲識別方法,應用于包括音頻輸入裝置的終端設備,其特征在于,所述方法包括:通過音頻輸入裝置接收用戶輸入的音頻;對所述音頻進行分析并確定所述音頻的面貌信息,所述面貌信息包括無效音頻、低信噪比音頻或高信噪比音頻;當所述面貌信息指示所述音頻為低信噪比音頻時,根據低信噪比識別策略對所述音頻進行識別,并輸出低信噪比識別結果;當所述面貌信息指示所述音頻為高信噪比音頻時,根據高信噪比識別策略對所述音頻進行識別,并輸出高信噪比識別結果;基于所述低信噪比識別結果或所述高信噪比識別結果確定所識別到的樂曲。
可選地,所述對所述音頻進行分析并確定所述音頻的面貌信息,包括:對所述音頻進行分幀處理,以得到多個音頻幀;分別計算各音頻幀屬于有效音頻幀的概率,當所述屬于有效音頻幀的概率大于或等于預設的第一閾值時,將對應的音頻幀確定為有效音頻幀;否則,將對應的音頻幀確定為無效音頻幀;統計有效音頻幀的數量,并計算有效音頻幀的數量與所述多個音頻幀的數量的比值;當所述比值小于預設的第二閾值時,確定所述面貌信息為無效音頻并停止對所述音頻的識別。
可選地,所述方法還包括:當所述比值大于或等于所述第二閾值時,基于所述有效音頻幀的數量計算所述屬于有效音頻幀的概率的均值;當所述均值大于或等于預設的第三閾值時,確定所述面貌信息為高信噪比音頻;否則,確定所述面貌信息為低信噪比音頻。
可選地,所述低信噪比識別策略包括多個識別子策略,所述根據低信噪比識別策略對所述音頻進行識別,包括:按照預設的順序依次調用所述多個識別子策略對所述音頻進行識別,并基于預設的曲庫依次確定通過各識別子策略識別到的至少一個識別子結果以及所述至少一個識別子結果與所述曲庫中的對應樂曲之間的低信噪比相似度;當與所述多個識別子策略中的一個識別子策略對應的低信噪比相似度大于或等于預設的第四閾值時,將與該識別子策略對應的樂曲確定為識別到的樂曲并且停止調用識別子策略對所述音頻進行識別。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于杭州網易云音樂科技有限公司,未經杭州網易云音樂科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110887131.6/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:水泥土墻內大直徑管樁連續送樁施工工法
- 下一篇:一種廢舊輪胎加工用切割裝置





