[發明專利]一種合成音樂的方法和裝置有效
| 申請號: | 202010598390.2 | 申請日: | 2020-06-28 |
| 公開(公告)號: | CN111724764B | 公開(公告)日: | 2023-01-03 |
| 發明(設計)人: | 張晴晴;賈艷明;張雪璐;岑吳镕 | 申請(專利權)人: | 北京愛數智慧科技有限公司 |
| 主分類號: | G10L13/02 | 分類號: | G10L13/02;G10H7/00 |
| 代理公司: | 北京智沃律師事務所 11620 | 代理人: | 吳志宏 |
| 地址: | 100044 北京市海淀區*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 合成 音樂 方法 裝置 | ||
本發明公開一種合成音樂的方法和裝置,該方法包括以下步驟:獲取用戶輸入的目標樂器的樂譜信息,將所述目標樂器的樂譜信息分解為所述目標樂器的樂譜音節;將所述目標樂器的樂譜音節轉換為對應的統一基礎音節;根據所述統一基礎音節和用戶選擇的音樂風格,生成對應的音樂文件。本發明能夠基于用戶錄入的樂譜信息(例如,古箏譜)以及選擇的音樂風格(例如,郎朗風格),生成相應的音樂文件,幫助沒有音樂基礎的用戶參與到音樂制作中,從而滿足用戶合成音樂的需求。
技術領域
本發明涉及音頻技術領域,特別涉及一種合成音樂的方法和裝置。
背景技術
TTS(Text To Speech,從文本到語音)技術是人機對話的一部分,是同時運用語言學和心理學的杰出之作,在內置芯片的支持之下,通過神經網絡的設計,把文字智能地轉化為自然語音流。TTS技術對文本文件進行實時轉換,轉換時間之短可以秒計算。在其特有智能語音控制器作用下,文本輸出的語音音律流暢,使得聽者在聽取信息時感覺自然,毫無機器語音輸出的冷漠與生澀感。TTS技術即將覆蓋國標一、二級漢字,具有英文接口,自動識別中、英文,支持中英文混讀。所有聲音采用真人普通話為標準發音,實現了120-150個漢字/分鐘的快速語音合成,朗讀速度達3-4個漢字/秒,使用戶可以聽到清晰悅耳的音質和連貫流暢的語調。TTS技術作為語音合成應用的一種,能夠將儲存于電腦中的文件,如幫助文件或者網頁,轉換成自然語音輸出。TTS技術不僅能幫助有視覺障礙的人閱讀計算機上的信息,更能增加文本文檔的可讀性。TTS應用包括語音驅動的郵件以及聲音敏感系統,并常與聲音識別程序一起使用。
然而,現有的TTS技術無法將樂譜信息轉換為對應的音樂文件,無法滿足用戶制作音樂的需求。
發明內容
本發明提供了一種合成音樂的方法和裝置,以解決現有技術無法滿足用戶制作音樂的需求的缺陷。
本發明提供了一種合成音樂的方法,包括以下步驟:
獲取用戶輸入的目標樂器的樂譜信息,將所述目標樂器的樂譜信息分解為所述目標樂器的樂譜音節;
將所述目標樂器的樂譜音節轉換為對應的統一基礎音節;
根據所述統一基礎音節和用戶選擇的音樂風格,生成對應的音樂文件。
可選地,所述的方法,還包括:
生成統一基礎音節對應關系表;
所述將所述目標樂器的樂譜音節轉換為對應的統一基礎音節,包括:
根據所述目標樂器的樂譜音節,查詢所述統一基礎音節對應關系表,得到與所述目標樂器的樂譜音節對應的統一基礎音節;
其中,所述統一基礎音節對應關系表包括多種樂器的所有樂譜音節與統一基礎音節的對應關系,所述多種樂器包括目標樂器。
可選地,所述生成統一基礎音節對應關系表,包括:
統計多種樂器的發音規則,畫出梅爾頻譜,并獲取多種樂器的所有樂譜音節在梅爾頻譜上的位置;
按照距離統計分布,對多種樂器的所有樂譜音節在梅爾頻譜上的位置進行歸類,將距離相近的樂譜音節歸為同一類,并確定與同一類樂譜音節對應的統一基礎音節;
根據多種樂器的所有樂譜音節與統一基礎音節的對應關系,生成統一基礎音節對應關系表。
可選地,所述的方法,還包括:
生成音樂風格模型;
所述根據所述統一基礎音節和用戶選擇的音樂風格,生成對應的音樂文件,包括:
將所述統一基礎音節和用戶選擇的音樂風格輸入到所述音樂風格模型,獲取所述音樂風格模型輸出的音樂文件。
可選地,所述生成音樂風格模型,包括:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京愛數智慧科技有限公司,未經北京愛數智慧科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010598390.2/2.html,轉載請聲明來源鉆瓜專利網。





