[發明專利]一種語音翻譯方法及裝置有效

申請號：	201810167142.5	申請日：	2018-02-28
公開（公告）號：	CN108447486B	公開（公告）日：	2021-12-03
發明（設計）人：	王雨蒙;徐偉;江源;胡國平;胡郁	申請（專利權）人：	科大訊飛股份有限公司
主分類號：	G10L15/26	分類號：	G10L15/26;G10L13/02;G10L13/08;G06F40/58
代理公司：	北京集佳知識產權代理有限公司 11227	代理人：	張小娜;王寶筠
地址：	230031 安徽***	國省代碼：	安徽;34
權利要求書：	查看更多	說明書：	查看更多
摘要：
搜索關鍵詞：	一種語音翻譯方法裝置
鉆瓜網技術展會專利詞庫專利權人專利榜在售專利公布日期熱門專利

【說明書】：

本申請公開了一種語音翻譯方法及裝置，所述方法包括：當獲取到源發音人的第一目標語音后，通過對第一目標語音進行語音翻譯，生成第二目標語音，其中，第二目標語音的語種與第一目標語音的語種不同，第二目標語音攜帶了源發音人的音色特征。可見，在對源發音人的語音即翻譯前語音進行語音翻譯時，由于考慮了源發音人本身具有的音色特征，使得翻譯后語音也具有源發音人的音色特征，從而使得該翻譯后語音聽起來更像是源發音人直接說出的語音。

技術領域

本申請涉及計算機技術領域，尤其涉及一種語音翻譯方法及裝置。

背景技術

隨著人工智能技術的日益成熟，人們越來越多地追求著利用智能技術來解決一些問題。例如，曾經人們需要花費大量的時間來學習一門新的語言，才能與以該語言為母語的人溝通，而現在，人們可以直接通過翻譯機，圍繞著語音識別、智能翻譯以及語音合成技術，來實現口語輸入、機器翻譯、并發音說出翻譯后的意思。

但是，在目前的語音翻譯技術中，將源發音人的語音進行翻譯后，得到的翻譯后語音完全是語音合成模型中的發音人的音色特征，在聽感上，是與源發音人完全不同的另一個發音人的音色特征。

發明內容

本申請實施例的主要目的在于提供一種語音翻譯方法及裝置，當對源發音人的語音進行翻譯時，能夠使翻譯后的語音具有源發音人的音色特征。

本申請實施例提供了一種語音翻譯方法，包括：

獲取源發音人的第一目標語音；

通過對所述第一目標語音進行語音翻譯，生成第二目標語音，其中，所述第二目標語音的語種與所述第一目標語音的語種不同，所述第二目標語音攜帶了所述源發音人的音色特征。

可選的，所述通過對所述第一目標語音進行語音翻譯，生成第二目標語音，包括：

通過對所述第一目標語音進行語音識別，生成語音識別文本；