[發明專利]一種音頻轉換方法及裝置在審
| 申請號: | 201710862220.9 | 申請日: | 2017-09-21 |
| 公開(公告)號: | CN107704534A | 公開(公告)日: | 2018-02-16 |
| 發明(設計)人: | 黃玉貴 | 申請(專利權)人: | 咪咕音樂有限公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30;G06F17/28 |
| 代理公司: | 北京派特恩知識產權代理有限公司11270 | 代理人: | 張振偉,姚開麗 |
| 地址: | 610000 四川省成都市高新*** | 國省代碼: | 四川;51 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 音頻 轉換 方法 裝置 | ||
技術領域
本發明涉及音頻處理技術,尤其涉及一種音頻轉換方法、音頻轉換裝置以及計算機可讀存儲介質。
背景技術
隨著移動終端技術的飛速發展,移動終端所能提供的功能變得越來越豐富,因此,依托于移動終端的移動應用也越來越朝著一個APP多種功能的方向發展。以音樂APP為例,音樂APP作為較為常見的娛樂APP,為了滿足用戶的娛樂需求,現在的音樂APP所能提供的功能已經從傳統只提供單純的聽歌功能轉換為還可以提供社交、消費、K歌等多種領域的功能。
在現有的音樂APP中,針對傳統的音樂播放功能以及K歌功能,主要為用戶提供調音功能,以便可以更好的滿足不同用戶的口味和風格,其中,所提供的調音功能主要是針對歌曲的音調、音準、節奏、曲調等方面的調節,例如,針對一首歌曲,用戶可以根據自己的喜好,調整歌曲的節奏與曲調,比如可以從“爵士、搖滾、古典以及流行”四種模式中選擇一個自己喜歡的模式,進而使得歌曲按照用戶所選模式的曲調以及節奏進行播放。而在進行K歌時,用戶也可以通過調整音調、音準以及節奏的方式,以使得自己演唱的歌曲盡量接近原唱。
而在社交以及消費這兩方面,現有的音樂APP所提供的功能多是非音樂播放方面的功能,例如,歌曲社區、聽歌交友、圖片分享、音樂分享、彩鈴定制以及電子專輯購買等方面的功能。而現有的音樂APP雖然提供的功能越來越豐富,但是這些功能主要都是針對音樂APP的非音樂播放方面的功能,例如音樂社交功能以及音樂消費功能等,而對于傳統的音樂播放領域,音樂APP所能提供的功能仍然主要為調音方面的功能,例如曲調、節奏等方面的調節,很明顯,這類功能的主要目的是為了能帶給用戶一個更好的聽歌體驗,并且要使用類似的調音功能也需要用戶具有一定的音樂常識與基礎,因而現有的音樂APP所能提供的這類調音功能的受眾范圍較小。因此,從整體上來說,現有的音樂APP所提供的功能在娛樂性方面仍略顯不足,尤其是在音樂APP的音樂播放方面,現有的音樂APP在音樂播放方面所提供的功能的娛樂性更顯不足。
由此可見,現有的音樂APP所提供的功能無法滿足用戶使用需求。
發明內容
有鑒于此,本發明實施例期望提供一種音頻轉換方法、音頻轉換裝置及存儲介質,能夠選擇一段音頻,并根據音頻轉換模式,對所述選擇的音頻發音進行轉換,達到不同的播放效果,以提高用戶體驗。
為達到上述目的,本發明實施例提供了一種音頻轉換方法:
獲取第一音頻數據以及轉換目標,確定出所述第一音頻數據的音節所對應的文本信息以及所述第一音頻數據的音頻特征,并確定出所述轉換目標的發音方式;
在設定的發音數據庫查詢出所述第一音頻數據的文本信息所對應于所述轉換目標發音方式的發音數據,根據所述文本信息的文字順序將所述發音數據進行合成,獲得第二音頻數據;
按照所述第一音頻數據的音頻特征,對所述第二音頻數據的音頻特征進行調音,確定出調音后的第二音頻數據。
其中,上述獲取第一音頻數據,確定出所述第一音頻數據的音頻特征,包括:
對所述第一音頻數據連續的音節進行采樣,確定出所述第一音頻數據的音頻特征,其中,所述音頻特征包括所述音頻數據的響度、音色以及音調。
其中,上述方法還包括:
采集單個文字不同發音方式的音頻數據,生成發音數據庫;其中,所述發音方式至少包括各個區域不同性別的發音方式;所述發音數據庫還包含所述文字所對應的不同發音方式的音頻數據在數據庫中存儲位置的索引信息。
其中,上述按照所述第一音頻數據的音頻特征,對所述第二音頻數據的音頻特征進行調整,包括:
根據所述第一音頻數據對應文字的音節的響度對所述第二音頻數據對應文字的發音音節的響度進行調音;
根據所述第一音頻數據對應文字的音節的音色對所述第二音頻數據對應文字的發音音節的音色進行調音;
根據所述第一音頻數據對應文字的音節的音調對所述第二音頻數據對應文字的發音音節的音調進行調音。
本發明實施例提供了一種音頻轉換裝置,所述裝置包括:
第一采集模塊,用于獲取第一音頻數據以及轉換目標,確定出所述第一音頻數據的音節所對應的文本信息以及所述第一音頻數據的音頻特征,并確定出所述轉換目標的發音方式;
轉換模塊,用于在設定的發音數據庫查詢出所述第一音頻數據的文本信息所對應于所述轉換目標發音方式的發音數據,根據所述文本信息的文字順序將所述發音數據進行合成,獲得第二音頻數據;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于咪咕音樂有限公司,未經咪咕音樂有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710862220.9/2.html,轉載請聲明來源鉆瓜專利網。





