[發(fā)明專利]梵唄音樂生成方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)在審
| 申請?zhí)枺?/td> | 202110311436.2 | 申請日: | 2021-03-24 |
| 公開(公告)號: | CN112951187A | 公開(公告)日: | 2021-06-11 |
| 發(fā)明(設(shè)計(jì))人: | 劉奡智;郭錦岳;韓寶強(qiáng);肖京 | 申請(專利權(quán))人: | 平安科技(深圳)有限公司 |
| 主分類號: | G10H7/00 | 分類號: | G10H7/00;G06N3/04;G06N3/08 |
| 代理公司: | 北京市京大律師事務(wù)所 11321 | 代理人: | 姚維 |
| 地址: | 518033 廣東省深圳市福田區(qū)福*** | 國省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 音樂 生成 方法 裝置 設(shè)備 存儲(chǔ) 介質(zhì) | ||
本發(fā)明涉及人工智能領(lǐng)域,公開了一種梵唄音樂生成方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)。所述方法包括:獲取待處理的音樂數(shù)據(jù)并輸入預(yù)置梵唄音樂生成模型,音樂數(shù)據(jù)包括歌詞和歌詞旋律;通過唱詞編碼器提取歌詞的唱詞隱碼向量,通過旋律編碼器提取歌詞旋律的旋律隱碼向量;將唱詞隱碼向量輸入唱詞解碼器進(jìn)行處理,輸出唱詞輸出向量;將各唱詞輸出向量與旋律隱碼輸入旋律解碼器進(jìn)行處理,輸出旋律輸出向量;將各唱詞輸出向量轉(zhuǎn)換為唱詞,將各旋律輸出向量轉(zhuǎn)換為旋律,生成唱詞旋律對;最后按照歌唱順序拼接各唱詞旋律對,得到梵唄音樂。本發(fā)明將旋律和唱詞有效結(jié)合,還原了梵唄音樂“一字多音”的特點(diǎn),使得生成出的音樂更加接近真實(shí)的佛教梵唄音樂。
技術(shù)領(lǐng)域
本發(fā)明涉及人工智能領(lǐng)域,尤其涉及一種梵唄音樂生成方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)。
背景技術(shù)
隨著人工智能技術(shù)的快速發(fā)展,利用人工智能算法進(jìn)行音樂創(chuàng)作是當(dāng)前的熱門研究之一。深度學(xué)習(xí)模型在人工智能算法進(jìn)行音樂創(chuàng)作的過程中被廣泛使用,然而大多數(shù)人工智能算法梵唄音樂生成系統(tǒng)更多的是對現(xiàn)代流行音樂的創(chuàng)作,因?yàn)楝F(xiàn)代流行音樂的歌詞通俗易懂,旋律易記易唱;而缺乏對歌詞結(jié)構(gòu)復(fù)雜,旋律節(jié)奏隨性這種類型音樂創(chuàng)作的能力。因此,利用人工智能算法生成類型復(fù)雜和多樣的音樂是十分具有難度的。
大多數(shù)人工智能生成音樂的系統(tǒng)更多的是對簡單類型音樂的創(chuàng)作,難以有一種深度學(xué)習(xí)模型可以生成類型復(fù)雜的音樂。因?yàn)閺?fù)雜的音樂創(chuàng)作不僅要考慮唱詞和旋律的生成,而且要考慮唱詞的含義能否被旋律所表達(dá),唱詞的含義能否與旋律所對應(yīng)這些問題。
發(fā)明內(nèi)容
本發(fā)明的主要目的在于解決如何生成具有梵唄音樂特色的音樂的技術(shù)問題。
本發(fā)明第一方面提供了一種梵唄音樂生成方法,包括:
獲取待處理的音樂數(shù)據(jù),并將所述音樂數(shù)據(jù)輸入預(yù)置梵唄音樂生成模型,其中,所述音樂數(shù)據(jù)包括歌詞和歌詞旋律,所述梵唄音樂生成模型包括唱詞編碼器、唱詞解碼器、旋律編碼器和旋律解碼器;
通過所述唱詞編碼器提取所述音樂數(shù)據(jù)中歌詞對應(yīng)的唱詞隱碼向量,以及通過所述旋律編碼器提取所述音樂數(shù)據(jù)中歌詞旋律對應(yīng)的旋律隱碼向量;
將所述唱詞隱碼向量輸入所述唱詞解碼器進(jìn)行處理,輸出所述歌詞中每一個(gè)字對應(yīng)的唱詞輸出向量,以及分別將所述各唱詞輸出向量與所述旋律隱碼向量輸入所述旋律解碼器進(jìn)行處理,輸出所述歌詞中每一個(gè)字對應(yīng)的旋律輸出向量;
分別將所述各唱詞輸出向量轉(zhuǎn)換為唱詞,以及分別將所述各旋律輸出向量轉(zhuǎn)換為所述各唱詞的旋律,并生成所述各唱詞與所述各唱詞的旋律組成的多個(gè)唱詞旋律對;
按照所述歌詞中每一個(gè)字的歌唱順序,拼接所述各唱詞旋律對,得到梵唄音樂。
可選的,在本發(fā)明第一方面的第一種實(shí)現(xiàn)方式中,在所述獲取待處理的音樂數(shù)據(jù)之前還包括:
采集多個(gè)梵唄音樂作為訓(xùn)練樣本,并對所述訓(xùn)練樣本進(jìn)行分割,得到唱詞數(shù)據(jù)和旋律數(shù)據(jù);
將所述唱詞數(shù)據(jù)轉(zhuǎn)化為離散向量,得到唱詞輸入向量;
將所述唱詞輸入向量輸入所述唱詞編碼器進(jìn)行處理,得到唱詞隱碼向量;
將所述唱詞隱碼向量輸入所述唱詞解碼器進(jìn)行處理,得到唱詞輸出向量;
根據(jù)所述唱詞輸出向量,調(diào)用預(yù)置損失函數(shù)采用梯度更新方法對所述唱詞編碼器和所述唱詞解碼器進(jìn)行參數(shù)優(yōu)化,直至所述唱詞編碼器和所述唱詞解碼器收斂,得到唱詞生成模型。
可選的,在本發(fā)明第一方面的第二種實(shí)現(xiàn)方式中,在所述采集多個(gè)梵唄音樂作為訓(xùn)練樣本,并對所述訓(xùn)練樣本進(jìn)行分割,得到唱詞數(shù)據(jù)和旋律數(shù)據(jù)之后,還包括:
將所述旋律數(shù)據(jù)轉(zhuǎn)化為離散向量,得到旋律離散向量;
將所述唱詞輸入向量和所述旋律離散向量拼接成一個(gè)向量,得到旋律輸入向量;
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于平安科技(深圳)有限公司,未經(jīng)平安科技(深圳)有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110311436.2/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G10H 電聲樂器;由機(jī)電裝置或電子發(fā)生器產(chǎn)生音調(diào)的樂器,或從數(shù)據(jù)存儲(chǔ)器合成音調(diào)的樂器
G10H7-00 從數(shù)據(jù)存儲(chǔ)器合成音調(diào)的樂器,例如計(jì)算機(jī)控制管風(fēng)琴
G10H7-02 .其中在音調(diào)波形的連續(xù)取樣點(diǎn)上的幅值儲(chǔ)存在一個(gè)或多個(gè)存儲(chǔ)器中
G10H7-08 .利用計(jì)算函數(shù)或多項(xiàng)式近似法計(jì)算在音調(diào)波形的連續(xù)取樣點(diǎn)上的幅值
G10H7-10 ..利用存儲(chǔ)在存儲(chǔ)器中的系數(shù)或參數(shù),例如傅立葉系數(shù)
G10H7-12 ..利用存儲(chǔ)在存儲(chǔ)器中的一組或多組參數(shù)并計(jì)算出一個(gè)或多個(gè)在先取樣點(diǎn)的幅值的遞歸算法
G10H7-04 ..以變化速率讀出幅值,例如按照音調(diào)、音高讀出
- 一種數(shù)據(jù)庫讀寫分離的方法和裝置
- 一種手機(jī)動(dòng)漫人物及背景創(chuàng)作方法
- 一種通訊綜合測試終端的測試方法
- 一種服裝用人體測量基準(zhǔn)點(diǎn)的獲取方法
- 系統(tǒng)升級方法及裝置
- 用于虛擬和接口方法調(diào)用的裝置和方法
- 線程狀態(tài)監(jiān)控方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)
- 一種JAVA智能卡及其虛擬機(jī)組件優(yōu)化方法
- 檢測程序中方法耗時(shí)的方法、裝置及存儲(chǔ)介質(zhì)
- 函數(shù)的執(zhí)行方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)





