[發明專利]有聲播放裝置及其播放方法在審
| 申請號: | 201811324524.0 | 申請日: | 2018-11-08 |
| 公開(公告)號: | CN111105776A | 公開(公告)日: | 2020-05-05 |
| 發明(設計)人: | 鄧廣豐;蔡政宏;谷圳;朱志國;劉瀚文 | 申請(專利權)人: | 財團法人資訊工業策進會 |
| 主分類號: | G10L13/00 | 分類號: | G10L13/00;G10L13/08;G10L25/18;G10L25/63;G09F27/00 |
| 代理公司: | 上海專利商標事務所有限公司 31100 | 代理人: | 徐偉 |
| 地址: | 中國臺灣臺北市1*** | 國省代碼: | 臺灣;71 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 有聲 播放 裝置 及其 方法 | ||
1.一種有聲播放裝置,其特征在于,包含:
一存儲器,用以存儲一文本;
一輸入裝置,用以接收來自一用戶的一第一指令;
一處理器,與該輸入裝置及該存儲器電性連接,用以將該文本轉換為一語音,其中該語音包含一目標角色語音;以及
一輸出裝置,與該處理器電性連接,用以輸出該語音;
其中該處理器還用以:
根據該第一指令自多個聲音模型中選擇一目標聲音模型,并將該目標聲音模型指定于該文本中的一目標角色;以及
在將該文本轉換為該語音的過程中,根據該目標聲音模型將該文本中屬于該目標角色的語句轉換成該目標角色語音。
2.如權利要求1所述的有聲播放裝置,其特征在于:
該存儲器還用以存儲一預設數據,該預設數據用以記錄該文本中的多個其他角色及該多個其他角色對應的多個其他聲音模型,且該多個其他聲音模型其中之一為該多個聲音模型其中之一;以及
該處理器還用以在將該文本轉換為該語音的過程中,根據該多個其他聲音模型將該文本中屬于該多個其他角色的語句轉換成多個其他角色語音,且該語音包含該目標角色語音及該多個其他角色語音。
3.如權利要求1所述的有聲播放裝置,其特征在于,該多個聲音模型的每一者是由該處理器或與該有聲播放裝置耦合的一云端服務器從一聲音文件中萃取多個聲音特征,并根據一特定性格而建立的,且該多個聲音特征包含該聲音文件的一音高特征、一語速特征以及一音頻特征。
4.如權利要求3所述的有聲播放裝置,其特征在于,該聲音文件是一真人錄音文件。
5.如權利要求1所述的有聲播放裝置,其特征在于:
該輸入裝置還用以接收來自該用戶的一第二指令;以及
該處理器還用以根據該第二指令,標記該多個聲音模型的其中之一為一收藏聲音模型。
6.如權利要求1所述的有聲播放裝置,其特征在于:
該輸入裝置還用以接收來自于該用戶的一第三指令;以及
該輸出裝置還用以根據該第三指令播放該多個聲音模型所各自轉換出的多個試聽聲音文件,以讓該用戶基于該多個試聽聲音文件選擇該多個聲音模型中的其中一者作為該目標聲音模型。
7.如權利要求1所述的有聲播放裝置,其特征在于,該多個聲音模型中的每一個包含一音色子模型,且該音色子模型包含一音高參數、一語速參數以及一音頻參數。
8.如權利要求7所述的有聲播放裝置,其特征在于,該多個聲音模型中的每一個還包含一情緒子模型,且該處理器還用以根據該文本中的語句情緒,使用該情緒子模型調整該音色子模型,且該語句情緒包含疑問、開心、生氣、難過。
9.如權利要求8所述的有聲播放裝置,其特征在于,該處理器還用以辨識該文本中的該目標角色以及屬于該目標角色的語句中的語句情緒。
10.如權利要求9所述的有聲播放裝置,其特征在于,該目標角色的語句中的語句情緒是由該處理器根據該文本中的該目標角色的語句中的至少一情緒特征詞而確認的。
11.一種用于一有聲播放裝置的播放方法,其特征在于,包含:
由該有聲播放裝置接收來自一用戶的一第一指令;
由該有聲播放裝置根據該第一指令自多個聲音模型中選擇一目標聲音模型,并將該目標聲音模型指定于該文本中的一目標角色;
由該有聲播放裝置將一文本轉換為一語音,其中該語音包含一目標角色語音;以及
由該有聲播放裝置輸出該語音;
其中,在該有聲播放裝置將該文本轉換為該語音的過程中還包含:
由該有聲播放裝置根據該目標聲音模型將該文本中屬于該目標角色的語句轉換成該目標角色語音。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于財團法人資訊工業策進會,未經財團法人資訊工業策進會許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811324524.0/1.html,轉載請聲明來源鉆瓜專利網。





