[發明專利]一種音頻文件生成方法及裝置、終端設備有效
| 申請號: | 201810028134.2 | 申請日: | 2018-01-11 |
| 公開(公告)號: | CN108242238B | 公開(公告)日: | 2019-12-31 |
| 發明(設計)人: | 李丹 | 申請(專利權)人: | 廣東小天才科技有限公司 |
| 主分類號: | G10L15/26 | 分類號: | G10L15/26;G10L25/63;G06F17/27;G06K9/00 |
| 代理公司: | 44381 廣州德科知識產權代理有限公司 | 代理人: | 萬振雄;王亞沛 |
| 地址: | 523841 廣東省東*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 聲音文件 音頻文件 背景音樂 情感特征 文本內容 終端設備 音頻處理技術 聽覺感受 語義分析 適配 錄制 外部 轉換 | ||
本發明實施例涉及音頻處理技術領域,公開了一種音頻文件生成方法及裝置、終端設備,該方法包括:錄制外部人聲以獲得聲音文件;將聲音文件轉換成文本內容;對該文本內容進行語義分析,以獲得聲音文件對應的情感特征;以該情感特征為依據,獲取聲音文件相適配的背景音樂和音效;對聲音文件添加背景音樂和音效,獲得音頻文件;實施本發明實施例,結合聲音文件的情感特征給以聲音文件添加背景音樂和音效,以提高音頻文件的聽覺感受。
技術領域
本發明涉及音頻處理技術領域,具體涉及一種音頻文件生成方法及裝置、終端設備。
背景技術
市面上推出的錄音軟件滿足了很多用戶的音樂夢,如用戶可以通過錄音軟件錄制出聲音文件,然后對聲音文件加以潤色,保存成通用的MP3格式等格式的音頻文件,然后可以在其它音頻播放軟件上進行播放。
但是目前市面上的錄音軟件只是對錄制的聲音文件加以簡單潤色,如去躁、混響等,最后得到的音頻文件的播放效果比較單調干澀,聽覺效果較差。
發明內容
本發明實施例公開了一種音頻文件生成方法及裝置、終端設備,用于解決現有錄制的音頻文件單調干涉的技術問題。
本發明第一方面公開了一種音頻文件生成方法,可包括:
錄制外部人聲以獲得聲音文件;
將所述聲音文件轉換成文本內容;
對所述文本內容進行語義分析,以獲得所述聲音文件對應的情感特征;
以所述情感特征為依據,獲取所述聲音文件相適配的背景音樂和音效;
對所述聲音文件添加所述背景音樂和所述音效,獲得音頻文件。
作為一種可選的實施方式,在本發明第一方面中,上述方法還包括:
在所述錄制外部人聲以獲得聲音文件的過程中,周期性拍攝錄音用戶的臉部圖像;
分析所述臉部圖像,獲得所述錄音用戶的表情特征;
獲取所述表情特征相對應的情緒特征;
所述以所述情感特征為依據,獲取所述聲音文件相適配的背景音樂和音效,包括:
以所述情感特征和所述情緒特征為依據,獲取所述聲音文件相適配的背景音樂和音效。
作為一種可選的實施方式,在本發明第一方面中,所述對所述文本內容進行語義分析,以獲得所述聲音文件對應的情感特征,包括:
識別所述文本內容的斷句點;
以所述斷句點為依據,將所述文本內容劃分成若干個短句;
分析所述短句的短句語義或提取所述短句的短句關鍵字;
根據每一個所述短句的短句語義或短句關鍵字,識別每一個所述短句的情感特征;
判斷所述短句中是否存在所述情感特征相同的連續的至少兩個短句;
如果存在,將所述至少兩個短句作為一個所述短句;
按照所述短句在所述文本內容中的位置,排序每一個所述短句的情感特征,獲得所述聲音文件的情感特征;
所述以所述情感特征為依據,獲取所述聲音文件相適配的背景音樂和音效,包括:
以所述文本內容的短句為依據,將所述聲音文件切割成多個播放時長的子文件,所述子文件與所述短句一一對應;
依序獲取所述子文件相適配的背景音樂和音效;
所述對所述聲音文件添加所述背景音樂和所述音效,獲得音頻文件包括:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于廣東小天才科技有限公司,未經廣東小天才科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810028134.2/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:語音處理設備、具有該設備的車輛以及語音處理方法
- 下一篇:一種聲紋識別方法





