[發(fā)明專利]文本播報方法、裝置、電子設備及存儲介質(zhì)有效
| 申請?zhí)枺?/td> | 201911229852.7 | 申請日: | 2019-12-04 |
| 公開(公告)號: | CN110941954B | 公開(公告)日: | 2021-03-23 |
| 發(fā)明(設計)人: | 石真;盧甜恬 | 申請(專利權)人: | 深圳追一科技有限公司 |
| 主分類號: | G06F40/205 | 分類號: | G06F40/205;G06F40/279;G06T13/20;G06T13/40 |
| 代理公司: | 深圳市智圈知識產(chǎn)權代理事務所(普通合伙) 44351 | 代理人: | 苗燕 |
| 地址: | 518057 廣東省深圳市南山區(qū)粵海街道*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 文本 播報 方法 裝置 電子設備 存儲 介質(zhì) | ||
本申請公開了一種文本播報方法、裝置、電子設備及存儲介質(zhì),該方法包括:獲取待播報文本,并將待播報文本轉(zhuǎn)換為音頻數(shù)據(jù);對待播報文本進行識別,獲得情感參數(shù),情感參數(shù)用于表征待播報文本中的播報對象的情感,情感參數(shù)包括表情參數(shù)、動作參數(shù)以及語氣參數(shù);獲取預先設置的播報虛擬人物;基于播報虛擬人物、情感參數(shù)、以及音頻數(shù)據(jù)生成與待播報文本對應的待播報視頻,其中,待播報視頻包括在待播報視頻的播放過程中,基于表情參數(shù)和動作參數(shù)更新播報虛擬人物的外在動作,以及基于語氣參數(shù)更新音頻數(shù)據(jù)的播報語氣特征;輸出待播報視頻。可以在用音頻的方式播報文本的同時,顯示虛擬人物來進行播報,從而提高文本播報的趣味性,提升了用戶體驗。
技術領域
本申請涉及電子設備技術領域,更具體地,涉及一種文本播報方法、裝置、電子設備及存儲介質(zhì)。
背景技術
隨著社會的進步和人們生活水平的逐步提高,人們獲取文本中信息的方式也越來越多,越來越方便。相比于之前僅能通過閱讀的方式來獲取文本中的信息,現(xiàn)在還可以通過音頻播放的方式來實現(xiàn)。
雖然音頻播放的方式可以方便用戶在不用看著文本的情況下也能獲取文本的信息,但是,音頻的表現(xiàn)形式比較單調(diào),用戶在聽了長時間音頻后通常會感到枯燥,導致用戶體驗較差。
發(fā)明內(nèi)容
鑒于上述問題,本申請?zhí)岢隽艘环N文本播報方法、裝置、電子設備及存儲介質(zhì),可以讓用戶同時從聽覺和視覺上去獲取文本中的信息,從而使文本信息能夠更加生動形象地表現(xiàn)出來,提升了用戶的閱讀體驗。
第一方面,本申請實施例提供了一種文本播報方法,該方法包括:獲取待播報文本,并將待播報文本轉(zhuǎn)換為音頻數(shù)據(jù);對待播報文本進行識別,獲得情感參數(shù),情感參數(shù)用于表征待播報文本中的播報對象的情感,情感參數(shù)包括表情參數(shù)、動作參數(shù)以及語氣參數(shù);獲取預先設置的播報虛擬人物;基于播報虛擬人物、情感參數(shù)、以及音頻數(shù)據(jù)生成與待播報文本對應的待播報視頻,其中,待播報視頻包括在待播報視頻的播放過程中,基于表情參數(shù)和動作參數(shù)更新播報虛擬人物的外在動作,以及基于語氣參數(shù)更新音頻數(shù)據(jù)的播報語氣特征;輸出待播報視頻。
可選地,該方法還包括:識別待播報文本中與播報對象關聯(lián)的關鍵詞;獲取與關鍵詞對應的虛擬動畫,以及與虛擬動畫對應的音頻信息;當待播報視頻播放到與關鍵詞對應的畫面時,將待播報視頻中的播報虛擬人物切換成虛擬動畫,并播放與虛擬動畫對應的音頻信息。
可選地,關鍵詞包括環(huán)境關鍵詞和實物關鍵詞,獲取與關鍵詞對應的虛擬動畫,具體包括:獲取與環(huán)境關鍵詞對應的虛擬環(huán)境,并獲取與實物關鍵詞對應的虛擬形象;基于虛擬環(huán)境和虛擬形象生成虛擬動畫。
可選地,在將待播報視頻中的播報虛擬人物切換成虛擬動畫,并播放與虛擬動畫對應的音頻信息之后,還包括:將關鍵詞在待播報文本中所處的段落確定為第一段落;將與第一段落相鄰的下一個段落確定為第二段落;判斷第二段落中是否存在關鍵詞;當不存在關鍵詞時,在待播報視頻播放到與第二段落對應的畫面時,將虛擬動畫切換成播報虛擬人物。
可選地,基于播報虛擬人物、情感參數(shù)、以及音頻數(shù)據(jù)生成與待播報文本對應的待播報視頻,包括:根據(jù)表情參數(shù)以及動作參數(shù)驅(qū)動播報虛擬人物,得到多幀播報圖像;根據(jù)語氣參數(shù)以及音頻數(shù)據(jù)合成播報語音;根據(jù)多幀播報圖像和播報語音生成待播報視頻。
可選地,獲取預先設置的播報虛擬人物,包括:獲取預先設置的多個虛擬人物,并將多個虛擬人物進行顯示,其中,每個虛擬人物對應一個播報音色,且每個虛擬人物對應的播報音色不同;獲取用戶輸入的選取指令;響應選取指令,從多個虛擬人物中選取與選取指令對應的虛擬人物;將與選取指令對應的虛擬人物確定為播報虛擬人物。
可選地,獲取預先設置的播報虛擬人物,包括:獲取用戶的屬性信息,屬性信息包括年齡和性別中的至少一種;根據(jù)屬性信息確定播報虛擬人物。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于深圳追一科技有限公司,未經(jīng)深圳追一科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201911229852.7/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 上一篇:一種電動車折疊桿機構
- 下一篇:一種組合水循環(huán)箱體結構





