[發明專利]一種音頻質量評價方法及系統在審
| 申請號: | 201611184259.1 | 申請日: | 2016-12-20 |
| 公開(公告)號: | CN108206027A | 公開(公告)日: | 2018-06-26 |
| 發明(設計)人: | 錢大偉 | 申請(專利權)人: | 北京酷我科技有限公司 |
| 主分類號: | G10L25/60 | 分類號: | G10L25/60;G10L25/30;G10L21/10;G06N3/08 |
| 代理公司: | 北京億騰知識產權代理事務所 11309 | 代理人: | 陳霽 |
| 地址: | 100084 北京市海淀區農大*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 訓練模型 測試文件 聲譜圖 訓練結果 樣本文件 質量評價 標注 自動化 圖像識別 問題轉化 音頻識別 音頻文件 歌曲 主觀 嗓音 測試 轉換 | ||
本發明實施例涉及一種音頻質量評價方法及系統,該方法包括:將測試文件輸入至音頻質量訓練模型,其中音頻質量訓練模型為對樣本文件進行訓練獲取的模型;利用音頻質量訓練模型,對測試文件進行訓練,獲取訓練結果;根據訓練結果,確定音頻文件的音頻質量。通過將樣本文件轉換為聲譜圖,并對所述聲譜圖做相應處理后,進行訓練。獲取音頻質量訓練模型,利用該音頻質量訓練模型對測試文件進行測試。將音頻識別問題轉化為圖像識別問題,實現了歌曲主觀質量的自動化標注。有效的評價出演唱者的嗓音質量,實現了歌曲主觀質量的自動化標注,而且利用聲譜圖可以很好的識別出演唱者的演唱質量。
技術領域
本發明涉及數據分析技術領域,尤其涉及一種音頻質量評價方法及系統。
背景技術
最近來隨著經濟水平的不斷提高,人們對精神層面也越來越關注,經常在家或去KTV等場所進行K歌娛樂,并應用軟件對演唱的歌曲進行評價。常見評價歌曲演唱方法是基于唱歌的節拍,即只要節拍對上即可。這并不能很好的評價唱歌者歌唱的到底好不好,只能判斷出是否合拍。
發明內容
本發明為了能夠有效的評價出演唱者的嗓音質量,提供了一種音頻質量評價方法及系統。
一方面,提供了一種音頻質量評價方法,包括:將測試文件輸入至音頻質量訓練模型,其中音頻質量訓練模型為對樣本文件進行訓練獲取的模型;利用音頻質量訓練模型,對測試文件進行訓練,獲取訓練結果;根據訓練結果,確定音頻文件的音頻質量。
優選地,將測試文件輸入至音頻質量訓練模型之前,方法還包括:制作音頻質量訓練模型。
進一步優選地,制作音頻質量訓練模型,具體包括:將樣本文件轉換為聲譜圖;對聲譜圖進行灰度處理,生成與聲譜圖對應的灰度圖;對灰度圖進行縮放;并對進行縮放后的灰度圖進行訓練,獲取音頻質量訓練模型。
優選地,將樣本文件轉換為聲譜圖,包括:采用短時傅里葉變換,將樣本文件轉換為聲譜圖。
優選地,對進行縮放后的灰度圖進行訓練,獲取音頻質量訓練模型,具體包括:利用卷積神經網絡算法,對進行縮放后的灰度圖進行訓練,獲取音頻質量訓練模型。
另一方面,提供了一種音頻質量評價系統,包括:輸入模塊,用于將測試文件輸入至音頻質量訓練模型,其中音頻質量訓練模型為對樣本文件進行訓練獲取的模型;訓練模塊,用于利用音頻質量訓練模型,對測試文件進行訓練,獲取訓練結果;質量評價模塊,用于根據訓練結果,確定音頻文件的音頻質量。
優選地,訓練模塊還用于,制作音頻質量訓練模型。
進一步優選地,訓練模塊具體用于:將樣本文件轉換為聲譜圖;對聲譜圖進行灰度處理,生成與聲譜圖對應的灰度圖;對灰度圖進行縮放;并對進行縮放后的灰度圖進行訓練,獲取音頻質量訓練模型。
優選地,訓練模塊具體用于:采用短時傅里葉變換,將樣本文件轉換為聲譜圖。
優選地,訓練模塊具體用于:利用卷積神經網絡算法,對進行縮放后的灰度圖進行訓練,獲取音頻質量訓練模型。
本發明實施例提供的一種音頻質量評價方法,通過將樣本文件轉換為聲譜圖,并對所述聲譜圖做相應處理后,進行訓練。獲取音頻質量訓練模型,利用該音頻質量訓練模型對測試文件進行測試。將音頻識別問題轉化為圖像識別問題,實現了歌曲主觀質量的自動化標注。有效的評價出演唱者的嗓音質量實現了歌曲主觀質量的自動化標注,而且利用聲譜圖可以很好的識別出演唱者的演唱質量。
附圖說明
為了更清楚地說明本發明實施例中的技術方案,下面將對實施例描述中所需要使用的附圖作簡單地介紹。顯而易見地,下面描述中的附圖僅僅是本發明的一些實施例。
圖1為本發明實施例提供的一種音頻質量評價方法的流程圖;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京酷我科技有限公司,未經北京酷我科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201611184259.1/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:確定音頻內容音高偏差的方法及裝置
- 下一篇:一種唱片機播放機構





