[發明專利]一種語音翻譯方法及裝置有效
| 申請號: | 201810167142.5 | 申請日: | 2018-02-28 |
| 公開(公告)號: | CN108447486B | 公開(公告)日: | 2021-12-03 |
| 發明(設計)人: | 王雨蒙;徐偉;江源;胡國平;胡郁 | 申請(專利權)人: | 科大訊飛股份有限公司 |
| 主分類號: | G10L15/26 | 分類號: | G10L15/26;G10L13/02;G10L13/08;G06F40/58 |
| 代理公司: | 北京集佳知識產權代理有限公司 11227 | 代理人: | 張小娜;王寶筠 |
| 地址: | 230031 安徽*** | 國省代碼: | 安徽;34 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 語音 翻譯 方法 裝置 | ||
本申請公開了一種語音翻譯方法及裝置,所述方法包括:當獲取到源發音人的第一目標語音后,通過對第一目標語音進行語音翻譯,生成第二目標語音,其中,第二目標語音的語種與第一目標語音的語種不同,第二目標語音攜帶了源發音人的音色特征。可見,在對源發音人的語音即翻譯前語音進行語音翻譯時,由于考慮了源發音人本身具有的音色特征,使得翻譯后語音也具有源發音人的音色特征,從而使得該翻譯后語音聽起來更像是源發音人直接說出的語音。
技術領域
本申請涉及計算機技術領域,尤其涉及一種語音翻譯方法及裝置。
背景技術
隨著人工智能技術的日益成熟,人們越來越多地追求著利用智能技術來解決一些問題。例如,曾經人們需要花費大量的時間來學習一門新的語言,才能與以該語言為母語的人溝通,而現在,人們可以直接通過翻譯機,圍繞著語音識別、智能翻譯以及語音合成技術,來實現口語輸入、機器翻譯、并發音說出翻譯后的意思。
但是,在目前的語音翻譯技術中,將源發音人的語音進行翻譯后,得到的翻譯后語音完全是語音合成模型中的發音人的音色特征,在聽感上,是與源發音人完全不同的另一個發音人的音色特征。
發明內容
本申請實施例的主要目的在于提供一種語音翻譯方法及裝置,當對源發音人的語音進行翻譯時,能夠使翻譯后的語音具有源發音人的音色特征。
本申請實施例提供了一種語音翻譯方法,包括:
獲取源發音人的第一目標語音;
通過對所述第一目標語音進行語音翻譯,生成第二目標語音,其中,所述第二目標語音的語種與所述第一目標語音的語種不同,所述第二目標語音攜帶了所述源發音人的音色特征。
可選的,所述通過對所述第一目標語音進行語音翻譯,生成第二目標語音,包括:
通過對所述第一目標語音進行語音識別,生成語音識別文本;
通過對所述語音識別文本進行文本翻譯,生成翻譯文本;
通過對所述翻譯文本進行語音合成,生成第二目標語音。
可選的,所述通過對所述翻譯文本進行語音合成,生成第二目標語音,包括:
將所述翻譯文本按照預設大小的文本單位進行切分,得到各個目標文本單位;
獲取各個目標文本單位的聲學參數,其中,所述聲學參數攜帶了所述源發音人的音色特征;
根據各個目標文本單位的聲學參數,對所述翻譯文本進行語音合成,生成第二目標語音。
可選的,所述方法還包括:
獲取所述源發音人的第一樣本語音,其中,所述第一樣本語音的語種與所述第二目標語音的語種相同;
將所述第一樣本語音的識別文本按照所述預設大小的文本單位進行切分,得到各個第一樣本文本單位;
從所述第一樣本語音中提取與所述第一樣本文本單位對應的第一語音片段;
從所述第一語音片段中提取聲學參數;
利用各個第一樣本文本單位以及與所述第一樣本文本單位對應的聲學參數,構建第一聲學模型;
則,所述獲取各個目標文本單位的聲學參數,包括:
利用所述第一聲學模型,獲取各個目標文本單位的聲學參數。
可選的,所述方法還包括:
獲取所述源發音人的第二樣本語音,其中,所述第二樣本語音的語種與所述第二目標語音的語種不同;
將所述第二樣本語音的識別文本按照所述預設大小的文本單位進行切分,得到各個第二樣本文本單位;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于科大訊飛股份有限公司,未經科大訊飛股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810167142.5/2.html,轉載請聲明來源鉆瓜專利網。





