[發明專利]車內含噪語音數據生成方法、裝置以及設備在審
| 申請號: | 202110694011.4 | 申請日: | 2021-06-22 |
| 公開(公告)號: | CN113409798A | 公開(公告)日: | 2021-09-17 |
| 發明(設計)人: | 朱培培;鄧引引;于超敏 | 申請(專利權)人: | 科大訊飛股份有限公司 |
| 主分類號: | G10L19/00 | 分類號: | G10L19/00 |
| 代理公司: | 北京維澳專利代理有限公司 11252 | 代理人: | 常小溪 |
| 地址: | 230088 安徽省*** | 國省代碼: | 安徽;34 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 內含 語音 數據 生成 方法 裝置 以及 設備 | ||
本發明公開了一種車內含噪語音數據生成方法、裝置以及設備,本發明的構思在于預先采集純實景車噪及純人聲聲源以構造出車用語音素材庫,該車用語音素材庫中的音頻資源用于與用戶所提需求結合,分別得到符合用戶期望的車內含噪語音數據的兩個獨立元素,純人聲聲源以及純實景車噪,然后將匹配出的純人聲聲源以及純實景車噪進行通道融合,生成用戶所需的目標車內含噪語音數據。本發明實現了對語音素材的復用,解決了當前實車實景人工錄制方式費時、費力、高成本等弊端,并有效提升了車用交互語音數據樣本的制作效率。
技術領域
本發明涉及車輛語音交互領域,尤其涉及一種車內含噪語音數據生成方法、裝置以及設備。
背景技術
隨著人工智能的興起,車載、教育、醫療都滲透了人工智能技術,智能語音作為人機交互的重要手段,廣泛應用于各個領域。其中車載場景不同于家居、醫療、客服等場景,其噪音環境更具有多樣性、不穩定性等特點,且車載場景涉及人身安全因素,對語音識別等效果要求較高,因而在優化語音識別等語音處理效果時,需要大量含噪聲及不含噪聲的測試語音音頻數據作為支撐。
其中,車內含噪語音數據集的構造往往需要實車在不同場地、環境條件下進行反復、多次實地采錄,其制作要求相對較高,導致整體成本也較高;此外,目前現有的車內含噪語音數據的制作方式通常只適用于單次目標效果的評估,也即是說經過反復多次在某一個場景中采集車內含噪語音數據完畢后,該數據集很難進行多場景復用,如果期望采錄的車內含噪語音數據能夠覆蓋全場景,則必然要耗費大量的時間和人力從海量車內含噪語音數據中,進行甄別、挑選、歸類等繁瑣工作;再有,目前經實車實地采錄的車內含噪語音數據在進行效果評估時難以做到單一、穩定因素比對,無法滿足實際測試對于準確性的需求。
據此,為了實現低成本優化車內語音交互識別等語音處理效果,針對不同的噪聲場景能夠快捷、低成本地制作車內含噪語音數據用于交互測試、模型訓練等,則是當下車載人工智能領域最為迫切需要的。
發明內容
鑒于上述,本發明旨在提供一種車內含噪語音數據生成方法、裝置以及設備,以及相應地提供了一種計算機數據存儲介質和計算機程序產品,以能夠方便、簡潔、低成本且高效率地制作車內含噪語音數據。
本發明采用的技術方案如下:
第一方面,本發明提供了一種車內含噪語音數據生成方法,其中包括:
預先創建語音素材庫,所述語音素材庫包含純人聲音頻數據以及實車純噪音音頻數據;
接收并解析用戶輸入的數據需求;
根據解析后的數據需求,從所述語音素材庫中分別匹配出與用戶需求對應的純人聲音頻數據以及實車純噪音音頻數據;
將匹配到的純人聲音頻數據以及實車純噪音音頻數據進行混音處理,生成車內含噪語音數據。
在其中至少一種可能的實現方式中,所述預先創建語音素材庫包括:
預先錄制不同的純人聲聲源素材,并對各純人聲聲源素材標注出人聲聲源信息,得到純人聲音頻數據;
預先錄制在不同場景下的實車純噪音素材,并對各實車純噪音素材標注出場景噪聲信息,得到實車純噪音音頻數據。
在其中至少一種可能的實現方式中,所述解析用戶輸入的數據需求包括:
根據用戶輸入的數據需求、標注人聲聲源信息的純人聲音頻數據、標注場景噪聲信息的實車純噪音音頻數據以及預先訓練的基于語義分析的預測模型,得到解析后的數據需求。
在其中至少一種可能的實現方式中,所述解析后的數據需求包括如下需求信息:
主要說話人的人聲特征與實車噪音場景信息,和/或人聲聲源能量與實車噪音能量的比例關系。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于科大訊飛股份有限公司,未經科大訊飛股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110694011.4/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種鳳爪發酵鹵制工藝
- 下一篇:基于圖像的交通擁堵識別方法、裝置以及設備
- 數據顯示系統、數據中繼設備、數據中繼方法、數據系統、接收設備和數據讀取方法
- 數據記錄方法、數據記錄裝置、數據記錄媒體、數據重播方法和數據重播裝置
- 數據發送方法、數據發送系統、數據發送裝置以及數據結構
- 數據顯示系統、數據中繼設備、數據中繼方法及數據系統
- 數據嵌入裝置、數據嵌入方法、數據提取裝置及數據提取方法
- 數據管理裝置、數據編輯裝置、數據閱覽裝置、數據管理方法、數據編輯方法以及數據閱覽方法
- 數據發送和數據接收設備、數據發送和數據接收方法
- 數據發送裝置、數據接收裝置、數據收發系統、數據發送方法、數據接收方法和數據收發方法
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置





