[發(fā)明專利]一種語音數(shù)據(jù)的擴(kuò)充方法、系統(tǒng)、電子設(shè)備及存儲介質(zhì)在審
| 申請?zhí)枺?/td> | 202011369921.7 | 申請日: | 2020-11-30 |
| 公開(公告)號: | CN112530399A | 公開(公告)日: | 2021-03-19 |
| 發(fā)明(設(shè)計)人: | 金炎馳;梁志婷;韓振龍 | 申請(專利權(quán))人: | 上海明略人工智能(集團(tuán))有限公司 |
| 主分類號: | G10L13/02 | 分類號: | G10L13/02 |
| 代理公司: | 青島清泰聯(lián)信知識產(chǎn)權(quán)代理有限公司 37256 | 代理人: | 李紅巖 |
| 地址: | 200030 上海市徐匯區(qū)*** | 國省代碼: | 上海;31 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 語音 數(shù)據(jù) 擴(kuò)充 方法 系統(tǒng) 電子設(shè)備 存儲 介質(zhì) | ||
本發(fā)明提出一種語音數(shù)據(jù)的擴(kuò)充方法、系統(tǒng)、電子設(shè)備及存儲介質(zhì),其方法技術(shù)方案包括對話設(shè)計步驟,根據(jù)一預(yù)設(shè)場景設(shè)計文本形式的對話內(nèi)容;文本轉(zhuǎn)化步驟,將所述對話內(nèi)容轉(zhuǎn)化為對話語音;音頻混合步驟,將所述對話語音與所述預(yù)設(shè)場景下的噪音混合,得到模擬音頻數(shù)據(jù)并輸出。本發(fā)明解決了現(xiàn)有語音數(shù)據(jù)的擴(kuò)充方法復(fù)雜且可靠性不強(qiáng)的問題。
技術(shù)領(lǐng)域
本發(fā)明屬于語言處理領(lǐng)域,尤其涉及一種可適用于語音識別技術(shù)的語音數(shù) 據(jù)的擴(kuò)充方法、系統(tǒng)、電子設(shè)備及存儲介質(zhì)。
背景技術(shù)
隨著信息技術(shù)的發(fā)展,互聯(lián)網(wǎng)的普及,實現(xiàn)人機(jī)之間人性化、智能化的有 效交互,構(gòu)建高效自然的人機(jī)交流環(huán)境,已經(jīng)成為當(dāng)前信息技術(shù)應(yīng)用和發(fā)展的 迫切需求。
近二十年來,語音識別技術(shù)取得顯著進(jìn)步,開始從實驗室走向市場。隨著 語音識別技術(shù)的飛速發(fā)展,語音輸入、語音擴(kuò)充、語音識別、語音判斷、語音 播放、語音調(diào)速等各種在線語音識別受到了越來越多的關(guān)注,人們預(yù)計,未來 10年內(nèi),語音識別技術(shù)將進(jìn)入工業(yè)、家電、通信、汽車電子、醫(yī)療、家庭服務(wù)、 消費電子產(chǎn)品等各個領(lǐng)域。語音識別聽寫機(jī)在一些領(lǐng)域的應(yīng)用被美國新聞界評 為1997年計算機(jī)發(fā)展十件大事之一。很多專家都認(rèn)為語音識別技術(shù)是2000年 至2010年間信息技術(shù)領(lǐng)域十大重要的科技發(fā)展技術(shù)之一。語音識別技術(shù)所涉及 的領(lǐng)域包括:信號處理、模式識別、概率論和信息論、發(fā)聲機(jī)理和聽覺機(jī)理、 人工智能等等。
目前在進(jìn)行對音頻的處理時往往需要進(jìn)行訓(xùn)練,在訓(xùn)練時往往需要增加不 同于說話人的語音當(dāng)做干擾項或?qū)为氄f話人的不同特征來當(dāng)做干擾項進(jìn)行訓(xùn) 練,目前最常用的技術(shù)是將未經(jīng)修改的音頻直接作為訓(xùn)練數(shù)據(jù),或者將音頻分 割成多段的語音,便于進(jìn)行語音中的特征提取生成語音特征,再通過多個語音 特征拼接成新音頻,但是這樣的音頻不具有很高的干擾性,需要本身存在原始 音頻,且原始音頻的切分重組會導(dǎo)致音頻丟失時序信息,以及環(huán)境信息和本身 的情感信息和內(nèi)容信息等。
發(fā)明內(nèi)容
本申請實施例提供了一種語音數(shù)據(jù)的擴(kuò)充方法、系統(tǒng)、電子設(shè)備及存儲介 質(zhì),以至少解決現(xiàn)有語音數(shù)據(jù)的擴(kuò)充方法復(fù)雜且可靠性不強(qiáng)的問題。
第一方面,本申請實施例提供了一種語音數(shù)據(jù)的擴(kuò)充方法,包括:對話設(shè) 計步驟,根據(jù)一預(yù)設(shè)場景設(shè)計文本形式的對話內(nèi)容;文本轉(zhuǎn)化步驟,將所述對 話內(nèi)容轉(zhuǎn)化為對話語音;音頻混合步驟,將所述對話語音與所述預(yù)設(shè)場景下的 噪音混合,得到模擬音頻數(shù)據(jù)并輸出。
優(yōu)選的,所述對話設(shè)計步驟還包括:根據(jù)一預(yù)設(shè)場景,獲取所述預(yù)設(shè)場景 下的文本數(shù)據(jù),通過獲取的所述文本數(shù)據(jù)設(shè)計對話內(nèi)容。
優(yōu)選的,所述文本轉(zhuǎn)化步驟還包括:將所述對話內(nèi)容通過一TTS系統(tǒng)轉(zhuǎn) 化為對話語音。
優(yōu)選的,所述音頻混合步驟包括:在一真實場景中播放所述對話語音,并 同時采集所述真實場景下的真實噪音數(shù)據(jù)與所述對話語音。
優(yōu)選的,所述音頻混合步驟包括:獲取現(xiàn)有的所述預(yù)設(shè)場景下的模擬噪音 數(shù)據(jù),并將所述對話語音直接與所述模擬噪音數(shù)據(jù)直接混合。
第二方面,本申請實施例提供了一種語音數(shù)據(jù)的擴(kuò)充系統(tǒng),適用于上述一 種語音數(shù)據(jù)的擴(kuò)充方法,包括:對話設(shè)計單元,根據(jù)一預(yù)設(shè)場景,獲取所述預(yù) 設(shè)場景下的文本數(shù)據(jù),通過獲取的所述文本數(shù)據(jù)設(shè)計對話內(nèi)容;文本轉(zhuǎn)化單元, 將所述對話內(nèi)容通過一TTS系統(tǒng)轉(zhuǎn)化為對話語音;音頻混合單元,將所述對話 語音與所述預(yù)設(shè)場景下的噪音混合,得到模擬音頻數(shù)據(jù)并輸出。
在其中一些實施例中,所述音頻混合單元包括:在一真實場景中播放所述 對話語音,并同時采集所述真實場景下的真實噪音數(shù)據(jù)與所述對話語音。
在其中一些實施例中,所述模型建立模塊還包括:所述音頻混合單元包括: 獲取現(xiàn)有的所述預(yù)設(shè)場景下的模擬噪音數(shù)據(jù),并將所述對話語音直接與所述模 擬噪音數(shù)據(jù)直接混合。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于上海明略人工智能(集團(tuán))有限公司,未經(jīng)上海明略人工智能(集團(tuán))有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011369921.7/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
- 數(shù)據(jù)顯示系統(tǒng)、數(shù)據(jù)中繼設(shè)備、數(shù)據(jù)中繼方法、數(shù)據(jù)系統(tǒng)、接收設(shè)備和數(shù)據(jù)讀取方法
- 數(shù)據(jù)記錄方法、數(shù)據(jù)記錄裝置、數(shù)據(jù)記錄媒體、數(shù)據(jù)重播方法和數(shù)據(jù)重播裝置
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)發(fā)送系統(tǒng)、數(shù)據(jù)發(fā)送裝置以及數(shù)據(jù)結(jié)構(gòu)
- 數(shù)據(jù)顯示系統(tǒng)、數(shù)據(jù)中繼設(shè)備、數(shù)據(jù)中繼方法及數(shù)據(jù)系統(tǒng)
- 數(shù)據(jù)嵌入裝置、數(shù)據(jù)嵌入方法、數(shù)據(jù)提取裝置及數(shù)據(jù)提取方法
- 數(shù)據(jù)管理裝置、數(shù)據(jù)編輯裝置、數(shù)據(jù)閱覽裝置、數(shù)據(jù)管理方法、數(shù)據(jù)編輯方法以及數(shù)據(jù)閱覽方法
- 數(shù)據(jù)發(fā)送和數(shù)據(jù)接收設(shè)備、數(shù)據(jù)發(fā)送和數(shù)據(jù)接收方法
- 數(shù)據(jù)發(fā)送裝置、數(shù)據(jù)接收裝置、數(shù)據(jù)收發(fā)系統(tǒng)、數(shù)據(jù)發(fā)送方法、數(shù)據(jù)接收方法和數(shù)據(jù)收發(fā)方法
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)再現(xiàn)方法、數(shù)據(jù)發(fā)送裝置及數(shù)據(jù)再現(xiàn)裝置
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)再現(xiàn)方法、數(shù)據(jù)發(fā)送裝置及數(shù)據(jù)再現(xiàn)裝置





