[發明專利]一種基于手持智能終端的場景化朗讀音頻制作方法及系統在審
| 申請號: | 201711414780.4 | 申請日: | 2017-12-21 |
| 公開(公告)號: | CN108536655A | 公開(公告)日: | 2018-09-14 |
| 發明(設計)人: | 孫仉茂;紀德財 | 申請(專利權)人: | 廣州市訊飛樽鴻信息技術有限公司 |
| 主分類號: | G06F17/22 | 分類號: | G06F17/22;G06F17/30;G06K9/20;G10L13/08 |
| 代理公司: | 廣州粵高專利商標代理有限公司 44102 | 代理人: | 林麗明 |
| 地址: | 510665 廣東省廣*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 智能終端 場景化 音頻制作 朗讀 文字內容 語音合成 背景音 獲取信息 手動設置 新聞播報 信息內容 音頻朗讀 音頻文件 用戶體驗 展示內容 知識傳播 轉換效率 自動選擇 音庫 音色 應用 采集 保存 融合 校園 節目 故事 軍事 | ||
1.一種基于手持智能終端的場景化朗讀音頻制作方法,其特征在于,包括以下步驟:
S1:使用手持智能終端獲取信息內容,并轉化為文字格式;
S2:對文字內容進行格式化處理,包括自動分段、刪除無效字符,最終獲得有效的純文本格式的內容;
S3:對文字內容的關鍵字進行自動識別,預判該內容的使用場景;
S4:根據預判的使用場景選擇播音員音庫、背景音、語速和語調;
S5:生成場景化音頻文件:根據所選擇的播音員音庫、語速和語調,通過語音合成技術將文字內容轉化為音頻,并加入背景音,生成音頻文件;
S6:將生成的音頻文件提供給用戶保存與分享。
2.根據權利要求1所述的基于手持智能終端的場景化朗讀音頻制作方法,其特征在于,所述手持智能終端為智能手機、iPad、平板電腦、PC電腦或智能手表。
3.根據權利要求1所述的基于手持智能終端的場景化朗讀音頻制作方法,其特征在于,步驟S1中,獲取信息內容的途徑包括以下四種方式:
通過文檔文件導入,支持但不限于TXT、WORD、PPT、PDF文件;
通過輸入網頁URL鏈接,自動識別與抓取文字內容;
通過手持智能終端在海報、雜志、報紙、電腦、平板媒介上展示的文字、圖片、視頻等內容進行拍照,通過OCR技術獲取文字內容;
通過編輯框錄入內容,支持手動編輯文字,或復制文字后粘貼在編輯框中。
4.根據權利要求1所述的基于手持智能終端的場景化朗讀音頻制作方法,其特征在于,步驟S3中,所述使用場景包括但不限于新聞播報、軍武介紹、故事文摘、校園廣播。
5.根據權利要求1所述的基于手持智能終端的場景化朗讀音頻制作方法,其特征在于,步驟S4具體包括:
S4.1:選擇播音員音庫:根據預判的使用場景自動選擇或手動選擇音庫音色;
S4.2:選擇背景音:根據預判的使用場景自動選擇或手動選擇背景音;
S4.3:選擇語速、語調:根據預判的使用場景自動選擇或手動選擇朗讀語速、語調。
6.根據權利要求1所述的基于手持智能終端的場景化朗讀音頻制作方法,其特征在于,步驟S6具體包括以下方式:
郵件發送:用戶可輸入郵箱地址,系統自動將相關內容與文件發送至用戶郵箱;
直接下載到本地:用戶可在終端界面直接下載音頻文件到終端設備中;
社交工具發送音頻文件:通過調用用戶的微信、QQ、微博等社交工具進行分享,將音頻文件發送給好友、群組,以及在朋友圈、個人空間分享;
社交工具分享音頻信息:通過調用用戶的微信、QQ等社交工具,將音頻信息存儲在后臺服務端,生成分享卡片發送給好友,或生成二維碼發送給好友,好友可通過二維碼查看與下載;
網盤存儲:通過調用用戶的百度網盤、360云盤第三方云存儲服務,將音頻文件存儲在互聯網網絡存儲空間。
7.一種基于手持智能終端的場景化朗讀音頻制作系統,其特征在于,包括手持智能終端和云服務端,所述云服務端包括文本格式智能處理模塊、場景智能識別模塊、播音員音庫選擇模塊、背景音選擇模塊、語速/語調選擇模塊和場景化音頻文件生成模塊;
所述手持智能終端獲取信息內容,轉化為文字格式并上傳到云服務器端;云服務器端的文本格式智能處理模塊對文字內容進行格式化處理,包括自動分段、刪除無效字符,最終獲得有效的純文本格式的內容;場景智能識別模塊對文字內容的關鍵字進行自動識別,預判該內容的使用場景;場景智能識別模塊、播音員音庫選擇模塊、背景音選擇模塊分別根據預判的使用場景選擇播音員音庫、背景音、語速和語調;場景化音頻文件生成模塊根據所選擇的播音員音庫、語速和語調,通過語音合成技術將文字內容轉化為音頻,并加入背景音,生成音頻文件;手持智能終端接收將生成的音頻文件提供給用戶保存與分享。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于廣州市訊飛樽鴻信息技術有限公司,未經廣州市訊飛樽鴻信息技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201711414780.4/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:識別文本展示方法及裝置
- 下一篇:基于WFST的文本正則化方法及系統





