[發明專利]一種基于唱段和念白提取的戲曲分類方法在審
| 申請號: | 202111330729.1 | 申請日: | 2021-11-11 |
| 公開(公告)號: | CN114120970A | 公開(公告)日: | 2022-03-01 |
| 發明(設計)人: | 牛娜娜;琚軍紅;王旭;王振華;魏萊;吳榛榛 | 申請(專利權)人: | 河南財政金融學院 |
| 主分類號: | G10L15/02 | 分類號: | G10L15/02;G10L15/04;G10L15/06;G10L15/08;G10L19/00;G10L19/02;G10L19/032;G10L21/013;G10L21/0272;G10L21/10 |
| 代理公司: | 北京國坤專利代理事務所(普通合伙) 11491 | 代理人: | 張國棟 |
| 地址: | 450046 河南省鄭州市*** | 國省代碼: | 河南;41 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 唱段 念白 提取 戲曲 分類 方法 | ||
本發明屬于機器學習中語音識別分離技術領域,公開了一種基于唱段和念白提取的戲曲分類方法,接收的音頻信號進行預處理,并執行正弦分析,正弦分析采用高斯混合模型聚類方法,以構建樂音色模型框架;檢測音頻信號的丟失音頻幀,通過編碼器創建替代幀;基于CDP算法將正弦分析和通過編碼器填補后的音頻信號重新檢測分析,基于唱段和念白提取將戲曲分類。本發明通過正弦分析采用高斯混合模型聚類方法,將聲音進行最大程度的模型建立,解決了對原始信息提取不準確的問題,之后通過編碼器創建替代幀將丟失的聲幀補全,進行智能化排序,通過基于CDP算法將正弦分析和通過編碼器填補后的音頻信號重新檢測分析,對唱段和念白提取將戲曲分類。
技術領域
本發明屬于機器學習中語音識別分離技術領域,尤其涉及一種基于唱段和念白提取的戲曲分類方法。
背景技術
目前,在戲曲中,唱段和念白是戲曲可缺少的表現形式,在海量的戲曲數據中如何準確地識別唱段和念白,如何根據唱段和念白尋找相關的戲曲是一個難以解決的問題。
雖然在聲音智能識別領域有很多是對于樂音語音的分類研究,但是戲曲分類還沿用傳統的技術手段。傳統手段是對一首戲曲的整體進行研究,這樣數據量大且繁雜,特征提取的效率也不高。而唱段和念白是戲曲中兩個比較有特點,有區分度的戲曲組成部分,現有的技術還沒有相關的聲音識別和提取技術。
通過上述分析,現有技術存在的問題及缺陷為:聲音中音調和聲色的原始信息提取不準確,現有的技術手段是在對原聲信息的基礎上直接進行識別,易造成識別不準確的問題。
發明內容
針對現有技術存在的問題,本發明提供了一種基于唱段和念白提取的戲曲分類方法。
本發明是這樣實現的,一種基于唱段和念白提取的戲曲分類方法,所述基于唱段和念白提取的戲曲分類方法,包括:
步驟一,接收的音頻信號進行預處理,并執行正弦分析,正弦分析采用高斯混合模型聚類方法,以構建樂音色模型框架;
步驟二,檢測音頻信號的丟失音頻幀,通過編碼器創建替代幀;
步驟三,基于CDP算法將正弦分析和通過編碼器填補后的音頻信號重新檢測分析,基于唱段和念白提取將戲曲分類;
所述正弦模型搭建模型框架為:
提取唱段和念白的原始數據,并將數據輸送至存儲器和處理器;
提取存儲器內樂音樣本的音色特征;通過與現有的音聲數據分段構建樂音音色匹配高斯混合模型;
采用正弦分析技術分析,將每個音段的樂音信號通過正弦軌跡曲線進行初步連接;
借助樂音音色匹配高斯混合模型對上述初步創建的框架進行樂器識別,實現音色模型框架的構建;所述
編碼器創建替代幀過程為:
對先前正弦分析的音頻信號輸送至解碼器;解碼器內部輸入單元接收編碼的音頻信號;
編碼器幀丟失隱藏單元對先前接收的重構音頻信號模型執行逐幀重構;創建丟失音頻幀的替代幀;
替代幀存儲到存儲器,提取替代幀填補到重構音頻信號模型框架。
進一步,所述步驟一中,音頻信號預處理包括:音頻信號采樣量化、音頻信號A/D轉換、音頻信號濾波、音頻信號預加重、音頻信號端點檢測。
進一步,所述音頻信號A/D轉換過程為:
將采集的音頻信號進行時間離散化,并進量化,音頻信號量化完成后,進行音頻信號的編碼,轉換成數字信號。
進一步,所述音頻信號濾波具體過程為:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于河南財政金融學院,未經河南財政金融學院許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202111330729.1/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種防盜保險金庫
- 下一篇:基于多源數據的瀝青路面質量分析與評估方法





