[發明專利]聲音信號分析設備以及聲音信號分析方法和程序有效
| 申請號: | 201410092701.2 | 申請日: | 2014-03-13 |
| 公開(公告)號: | CN104050972B | 公開(公告)日: | 2019-07-30 |
| 發明(設計)人: | 前澤陽 | 申請(專利權)人: | 雅馬哈株式會社 |
| 主分類號: | G10L25/48 | 分類號: | G10L25/48 |
| 代理公司: | 北京天昊聯合知識產權代理有限公司 11112 | 代理人: | 陳源;李銘 |
| 地址: | 日本*** | 國省代碼: | 日本;JP |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 聲音 信號 分析 設備 以及 方法 程序 | ||
1.一種聲音信號分析設備,包括:
聲音信號輸入裝置,其用于輸入表示樂曲的聲音信號;
特征值計算裝置,其用于計算第一特征值和第二特征值,所述第一特征值表示與所述樂曲的各部分當中的一個部分中的節拍的存在相關的特征,所述第二特征值表示與所述樂曲的各部分當中的一個部分中的拍速相關的特征;以及
估計裝置,其用于通過從多個概率模型中選擇其觀測似然度的序列滿足一定的標準的一個概率模型來同時估計所述樂曲中的節拍位置和拍速變化,所述多個概率模型被描述為根據與所述樂曲的各部分當中的一個部分中的節拍的存在相關的物理量和與所述樂曲的各部分當中的一個部分中的拍速相關的物理量的結合來分類的各狀態的序列,所述一個概率模型的所述觀測似然度的序列中的每一個觀測似然度表示所述樂曲中的相應一個部分中的所述第一特征值和所述第二特征值的同時觀測概率。
2.根據權利要求1所述的聲音信號分析設備,其中
所述估計裝置通過從所述多個概率模型中選擇最可能的觀測似然度的序列的概率模型來同時估計所述樂曲中的節拍位置和拍速變化。
3.根據權利要求1所述的聲音信號分析設備,其中
所述估計裝置具有第一概率輸出裝置,其用于輸出這樣的概率來作為所述第一特征值的觀測概率:所述概率是通過將所述第一特征值指定為根據與節拍的存在相關的物理量而定義的概率分布函數的概率變量來計算得到的。
4.根據權利要求3所述的聲音信號分析設備,其中
所述第一概率輸出裝置輸出通過將所述第一特征值指定為根據與節拍的存在相關的物理量來定義的正態分布、伽馬分布和泊松分布中的任何一個的概率變量而計算出的概率,來作為所述第一特征值的觀測概率。
5.根據權利要求1所述的聲音信號分析設備,其中
所述估計裝置具有第二概率輸出裝置,其用于將所述第二特征值的擬合優度輸出至根據與拍速相關的物理量而提供的多個模板來作為所述第二特征值的觀測概率。
6.根據權利要求1所述的聲音信號分析設備,其中
所述估計裝置具有第二概率輸出裝置,其用于輸出這樣的概率來作為所述第二特征值的觀測概率:所述概率是通過將所述第二特征值指定為根據與拍速相關的物理量而定義的概率分布函數的概率變量而計算得到的。
7.根據權利要求6所述的聲音信號分析設備,其中
所述第二概率輸出裝置輸出通過將所述第二特征值指定為根據與拍速相關的物理量來定義的多項分布、狄利克雷分布、多維正態分布、以及多維泊松分布中的任何一個的概率變量而計算出的概率,作為所述第二特征值的觀測概率。
8.根據權利要求1所述的聲音信號分析設備,其中
所述樂曲的各部分分別對應于通過以一定的時間間隔來劃分所輸入的聲音信號而形成的各幀;并且
所述特征值計算裝置具有:
第一特征值計算裝置,其用于針對每個幀來計算振幅譜,將各自具有不同頻帶的多個窗函數應用至所述振幅譜,以生成每個頻帶的振幅譜,并且將基于針對各幀之間的每個頻帶提供的振幅譜的變化而計算出的值輸出作為所述第一特征值;以及
第二特征值計算裝置,其具有濾波器,所述濾波器響應于每一個與幀對應的值的輸入來輸出值,所述濾波器具有用于將所輸出的值保持一定時間段的保持裝置,并且所述濾波器將所輸入的值和保持了一定時間段的值以一定的比率結合并輸出所結合的值,所述第二特征值計算裝置將這樣的數據序列輸出作為所述第二特征值的序列的數據序列:所述數據序列是通過將對通過將所述第一特征值的序列輸入至所述濾波器而得到的數據序列的時間序列進行顛倒來獲得的數據序列輸入至所述濾波器而得到的。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于雅馬哈株式會社,未經雅馬哈株式會社許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201410092701.2/1.html,轉載請聲明來源鉆瓜專利網。





