[發明專利]一種動態歸一化數字特征的語音評分方法與裝置有效
| 申請號: | 201210042642.9 | 申請日: | 2012-02-23 |
| 公開(公告)號: | CN102592589A | 公開(公告)日: | 2012-07-18 |
| 發明(設計)人: | 寧更新;林廣超;韋崗 | 申請(專利權)人: | 華南理工大學 |
| 主分類號: | G10L11/04 | 分類號: | G10L11/04 |
| 代理公司: | 廣州粵高專利商標代理有限公司 44102 | 代理人: | 何淑珍 |
| 地址: | 510640 廣*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 動態 歸一化 數字 特征 語音 評分 方法 裝置 | ||
技術領域
本發明涉及聲音信號處理,具體涉及利用動態歸一化數字特征對跟讀或模仿的語音進行評分的方法和裝置。
背景技術
語音評分系統在實際生活中有許多應用。比如說某些KTV會裝有評分系統,當用戶演唱完畢會給用戶打分。無論是怎樣的應用,基本上都是把用戶的信號輸入到系統后與原聲進行比較,根據某個準則判斷兩段語音信號的相似度,給用戶打分。
實際應用中判斷準則有很多種。目前常見的比較準則有基于音量的方法(如CN?102110435A),基于能量的方法,還有基于音調的方法等等。基于音量的方法采集目標聲音的模擬信號,將模擬信號轉變為數字信號。然后計算用戶聲音數字信號與原音數字信號之間音量的差值,根據這個差值進行打分。差值越小則分數越高。基于能量的方法則是比較數字化的目標聲音信號的能量與原唱能量之間的差距。基于音調的準則從頻域的角度來考慮,比較目標聲音的頻率與原音頻率之間的偏離程度。除此之外,還可以比較目標聲音與原唱之間的相關函數的差距(如CN?102103852A)。
但是,從現實的角度上講,無論聲音的音量或是能量都是對原音和目標聲音之間的幅度進行比較,是從時域的角度進行比較,而語音的特性在頻域上體現,因此從時域上進行比較誤差較大,不足以客觀地衡量原唱與目標聲音之間的相似度。圖1為三段相同語音不同人跟讀的基音變化圖,曲線1表示原音,曲線2和3表示兩個目標跟讀語音。若根據現有的音量、能量、頻率偏差等方法來進行評分,結果是曲線2較曲線3與曲線1的相似度較高。然而實際情況是曲線3與曲線1的讀音更接近,兩者的動態變化規律相似。因此,用常用的音量、能量、頻率偏差等靜態特征來評分就不夠客觀。
本發明針對這些不足提出了一種利用原音與目標聲音的歸一化動態特征進行評分的技術。聲音的一個重要的聲學特征是共振峰。聲道可以看成是一根具有非均勻截面的聲管,在發音時起共鳴器的作用。當激勵進入聲道時會引起共振特性,產生一組共振頻率,稱為共振峰頻率或簡稱為共振峰。如圖2所示一幀語音的頻譜圖,實線的局部最大值即是共振峰頻率,是共振峰語音的一個重要的特征參數。本發明從頻域的角度出發,提取原音與目標聲音的歸一化共振峰動態特征,進行語音評分,來消除現有評分系統采用靜態特征評分帶來的不足。
發明內容
本發明的目的在于克服現有評分系統采用靜態特征評分帶來的不足,提出了一種動態歸一化數字特征的語音評分方法與裝置,使用語音的歸一化動態特征對目標聲音進行評分,提高了評分的科學性。本發明通過如下技術方案實現。
一種動態歸一化數字特征的語音評分方法,包括以下步驟:
步驟1:對目標音進行數字化處理,處理結束后進行定位,確定目標音的最小評判單元的起終點,分幀后目標音一共有K幀,原音以幀為單位一共有L幀;
步驟2:對原音和目標音分別使用共振峰檢測算法或頻率估計算法進行特征提取,得到原音和目標音的前N個共振峰頻率值,分別用ω原(i,n)(1≤i≤L,1≤n≤N)和ω目標(i,n)(1≤i≤K,1≤n≤N)表示原音和目標音第i幀的第n個共振峰頻率值;
步驟3:判斷原音與目標音的幀數是否相同,若相同則跳過此步驟,若不同則進行抽取和內插;取任意一個共振峰,則對于原音,這個共振峰對應一個長度為L的序列,對于目標音則對應一個長度為K的序列,利用內插和抽取消除幀數的不同,經內插和抽取之后的序列長度為M,對其它共振峰對應的序列進行相同的處理,分別用ω′原(i,n)(1≤i≤M,1≤n≤N)和ω′目標(i,n)(1≤i≤M,1≤n≤N)表示幀數歸一化后原音和目標音第i幀的第n個共振峰頻率值;
步驟4:由步驟3中幀數歸一化后的頻率值獲取原音和目標音的動態特征,用Δω原(i,n)和Δω目標(i,n)分別表示原音和目標音共振峰的變化,計算原音和目標音前后兩個頻率之間的差值:
Δω原(i,n)=ω′原(i+1,n)-ω′原(i,n)
(公式1)
Δω目標(i,n)=ω′目標(i+1,n)-ω′目標(i,n)????????(公式2)
其中1≤i≤M-1,1≤n≤N;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于華南理工大學,未經華南理工大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201210042642.9/2.html,轉載請聲明來源鉆瓜專利網。





