[發明專利]一種音頻文件生成方法及裝置、終端設備有效

申請號：	201810028134.2	申請日：	2018-01-11
公開（公告）號：	CN108242238B	公開（公告）日：	2019-12-31
發明（設計）人：	李丹	申請（專利權）人：	廣東小天才科技有限公司
主分類號：	G10L15/26	分類號：	G10L15/26;G10L25/63;G06F17/27;G06K9/00
代理公司：	44381 廣州德科知識產權代理有限公司	代理人：	萬振雄;王亞沛
地址：	523841 廣東省東***	國省代碼：	廣東;44
權利要求書：	查看更多	說明書：	查看更多
摘要：
搜索關鍵詞：	聲音文件音頻文件背景音樂情感特征文本內容終端設備音頻處理技術聽覺感受語義分析適配錄制外部轉換
鉆瓜網技術展會專利詞庫專利權人專利榜在售專利公布日期熱門專利

【說明書】：

本發明實施例涉及音頻處理技術領域，公開了一種音頻文件生成方法及裝置、終端設備，該方法包括：錄制外部人聲以獲得聲音文件；將聲音文件轉換成文本內容；對該文本內容進行語義分析，以獲得聲音文件對應的情感特征；以該情感特征為依據，獲取聲音文件相適配的背景音樂和音效；對聲音文件添加背景音樂和音效，獲得音頻文件；實施本發明實施例，結合聲音文件的情感特征給以聲音文件添加背景音樂和音效，以提高音頻文件的聽覺感受。

技術領域

本發明涉及音頻處理技術領域，具體涉及一種音頻文件生成方法及裝置、終端設備。

背景技術

市面上推出的錄音軟件滿足了很多用戶的音樂夢，如用戶可以通過錄音軟件錄制出聲音文件，然后對聲音文件加以潤色，保存成通用的MP3格式等格式的音頻文件，然后可以在其它音頻播放軟件上進行播放。

但是目前市面上的錄音軟件只是對錄制的聲音文件加以簡單潤色，如去躁、混響等，最后得到的音頻文件的播放效果比較單調干澀，聽覺效果較差。

發明內容

本發明實施例公開了一種音頻文件生成方法及裝置、終端設備，用于解決現有錄制的音頻文件單調干涉的技術問題。

本發明第一方面公開了一種音頻文件生成方法，可包括：

錄制外部人聲以獲得聲音文件；

將所述聲音文件轉換成文本內容；

對所述文本內容進行語義分析，以獲得所述聲音文件對應的情感特征；

以所述情感特征為依據，獲取所述聲音文件相適配的背景音樂和音效；

對所述聲音文件添加所述背景音樂和所述音效，獲得音頻文件。

作為一種可選的實施方式，在本發明第一方面中，上述方法還包括：

在所述錄制外部人聲以獲得聲音文件的過程中，周期性拍攝錄音用戶的臉部圖像；

分析所述臉部圖像，獲得所述錄音用戶的表情特征；

獲取所述表情特征相對應的情緒特征；

所述以所述情感特征為依據，獲取所述聲音文件相適配的背景音樂和音效，包括：

以所述情感特征和所述情緒特征為依據，獲取所述聲音文件相適配的背景音樂和音效。

作為一種可選的實施方式，在本發明第一方面中，所述對所述文本內容進行語義分析，以獲得所述聲音文件對應的情感特征，包括：

識別所述文本內容的斷句點；

以所述斷句點為依據，將所述文本內容劃分成若干個短句；

分析所述短句的短句語義或提取所述短句的短句關鍵字；

根據每一個所述短句的短句語義或短句關鍵字，識別每一個所述短句的情感特征；

判斷所述短句中是否存在所述情感特征相同的連續的至少兩個短句；

如果存在，將所述至少兩個短句作為一個所述短句；

按照所述短句在所述文本內容中的位置，排序每一個所述短句的情感特征，獲得所述聲音文件的情感特征；

所述以所述情感特征為依據，獲取所述聲音文件相適配的背景音樂和音效，包括：

以所述文本內容的短句為依據，將所述聲音文件切割成多個播放時長的子文件，所述子文件與所述短句一一對應；

依序獲取所述子文件相適配的背景音樂和音效；

所述對所述聲音文件添加所述背景音樂和所述音效，獲得音頻文件包括：

下載完整專利技術內容需要扣除積分，VIP會員可以免費下載。

免登錄下載普通用戶下載升級VIP會員，免費下載

該專利技術資料僅供研究查看技術是否侵權等信息，商用須獲得專利權人授權。該專利全部權利屬于廣東小天才科技有限公司，未經廣東小天才科技有限公司許可，擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作，請聯系【客服】

本文鏈接：http://www.szxzyx.cn/pat/books/201810028134.2/2.html，轉載請聲明來源鉆瓜專利網。

上一篇：語音處理設備、具有該設備的車輛以及語音處理方法
下一篇：一種聲紋識別方法

同類專利

專利分類

G 物理

G10 樂器；聲學
G10L 語音分析或合成；語音識別；音頻分析或處理
G10L15-00 語音識別
G10L15-02 .語音識別的特征提取；識別單位的選擇
G10L15-04 .分段或字極限檢測
G10L15-06 .創建基準模板；訓練語音識別系統，例如對說話者聲音特征的適應
G10L15-08 .語音分類或檢索
G10L15-20 .專門適用于不利環境

免登錄下載普通用戶下載升級VIP會員，免費下載

專利文獻下載

說明：

1、專利原文基于中國國家知識產權局專利說明書；

2、支持發明專利、實用新型專利、外觀設計專利（升級中）；

3、專利數據每周兩次同步更新，支持Adobe PDF格式；

4、內容包括專利技術的結構示意圖、流程工藝圖或技術構造圖；

5、已全新升級為極速版,下載速度顯著提升！歡迎使用！

請您登陸后，進行下載，點擊【登陸】【注冊】