[發明專利]唱歌評測方法及系統有效
| 申請號: | 201210120560.1 | 申請日: | 2012-04-23 |
| 公開(公告)號: | CN102664016A | 公開(公告)日: | 2012-09-12 |
| 發明(設計)人: | 蔣成林;何婷婷;胡國平;胡郁;劉慶峰 | 申請(專利權)人: | 安徽科大訊飛信息科技股份有限公司 |
| 主分類號: | G10L19/00 | 分類號: | G10L19/00;G10L15/04;G10L15/06;G10L15/14 |
| 代理公司: | 北京集佳知識產權代理有限公司 11227 | 代理人: | 趙景平;王寶筠 |
| 地址: | 230088 安徽*** | 國省代碼: | 安徽;34 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 唱歌 評測 方法 系統 | ||
技術領域
本發明涉及語音信號處理技術領域,特別涉及一種唱歌評測方法及系統。
背景技術
近年來,一些卡拉OK產品在用戶演唱結束后給出計分,提高了娛樂互動性。傳統唱歌評分系統通常采用比較用戶唱歌語音數據的音高曲線及預設標準音高曲線差異的方法,通過直接計算它們基頻曲線之間的誤差面積大小或在利用動態時間規整(Dynamic?Time?Warping,簡稱DTW)等技術對基頻曲線對齊規整后計算基頻曲線之間的差異來評價唱歌水平的高低。曲線差異值越大則用戶唱歌數據得分越低;反之則用戶唱歌數據得分越高。該方法在用戶數據與標準音高曲線節奏不一致時容易導致評分過低的問題。
為此,業界提出了一種基于連續語音信號切分的單獨唱詞片斷基頻標準度評估的方法。該方法首先將連續語音信號相對于各唱詞單元進行對齊,隨后對切分的音符語音片斷的標準度進行評估,進而獲知連續語音信號的標準度。通過唱詞對齊實現了用戶語音信號和標準參考信號的有效對應,可以使評判評分更加準確合理。
顯然,基于唱詞對齊的音符評分系統性能的好壞主要依賴于音符對齊效果以及單獨唱詞片段的評分結果。音符對齊越準確以及單個唱詞片段評分越客觀,則整體評分結果越合理。現有技術中通常采用距離度量的方法計算單個唱詞片斷的標準度,即將提取的唱詞片段的聲學特征,如音高特征和系統預存的基于樂譜構建的音符標準音高匹配并計算差異。然而在實際應用中,用戶音高往往存在波動,如通常所說的Vibration(顫音)現象;另外音高也容易受到上下文影響,在不同音符轉換時存在如通常所說的Preparation(預準備)、OverShort的現象,在實際音高曲線上不是表現為自然的連接曲線,而是需要經歷一個準備過程和后續過程。在不同音符切換時,用戶無法實現高低音的跳躍,而是需要經歷一個連續過程;另外相同音符在不同上下文環境中會表現出一定的差異性。可見,即使用戶的音高曲線與樂譜設定的標準音高走勢完全一致,但由于根據樂譜標準值設定的標準音高曲線,由于無法體現音符的上下文相關變化,無法準確細致地模擬用戶音高變化曲線,用戶音高變化曲線中的各種噪音干擾使得用戶最終評分較低,影響到對唱歌評測的合理性。
為了更好地模擬音符在不同上下文中的變化,研究人員提出了基于音高曲線擬和的方法,設定音高曲線y(t)為標準音符值h(t)和二階阻尼函數f(t)的卷積加上一個誤差函數e(t),即:
y(t)=f(t)*h(t)+e(t)。
對給定待測唱詞片段,系統針對唱歌時的Preparation、OverShort、Vibration等現象采用不同的樣條曲線加權擬和用戶的音高曲線,并通過參數估計實現用戶音高曲線的分解,得到用戶真實的音高值,隨后據此和預設標準值比較計算差異。
這種基于音高曲線擬和的方法在計算每個音符真實音高時需要估計較多的參數值,而在音符時長有限(短的只有0.1秒)的情況下,訓練數據量相對較少,因而容易過擬合導致參數估計不夠魯棒,影響系統的評測性能。
發明內容
本發明實施例提供一種唱歌評測系統及方法,提高音符匹配的客觀性和準確性,提升唱歌評測系統的評測性能。
一種唱歌評測方法,包括:
接收用戶唱歌的連續語音信號;
確定所述連續語音信號中每個音符的邊界位置,以切分出每個音符;
選擇切分出的每個音符對應的音調模型,所述音調模型是預先以離線方式訓練得到的;
提取所述音符的音調特征;
根據所述音符的音調特征、以及與所述音符相對應的音調模型計算所述音符的標準度;
根據所述音符的標準度確定唱歌評測得分。
優選地,所述方法還包括:
將預先采集的歌曲訓練數據切分為與不同音符對應的語音片段;
按照所述語音片段對應的音符對所述語音片段歸類;
對每一類語音片斷,分別按時間順序提取其中每一個語音片斷的音調特征,生成對應所述音符的特征序列;
構建音調模型拓撲;
對每個音符,利用該音符對應的所有訓練數據的特征序列訓練對應所述音調模型拓撲的參數;
所述選擇切分出的每個音符對應的音調模型包括:
選擇切分出的每個音符對應的用于模擬音符的音高特征的音調模型;
所述提取所述音符的音調特征包括:
提取每個音符的基頻特征或音高特征,并將所述基頻特征或音高特征作為所述音調特征。
優選地,所述方法還包括:
將預先采集的歌曲訓練數據切分為與不同音符對應的語音片段;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于安徽科大訊飛信息科技股份有限公司,未經安徽科大訊飛信息科技股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201210120560.1/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:傳感器網絡節點的定位方法及裝置
- 下一篇:無線傳感網絡節點定位的方法





