[發明專利]用于錄制音頻的方法、裝置、設備和介質有效

申請號：	202110870066.6	申請日：	2021-07-30
公開（公告）號：	CN113593619B	公開（公告）日：	2022-08-09
發明（設計）人：	李占學	申請（專利權）人：	北京百度網訊科技有限公司
主分類號：	G11C7/16	分類號：	G11C7/16;G11B27/031;G11B27/10;G10L21/0208
代理公司：	北京市漢坤律師事務所 11602	代理人：	姜浩然;吳麗麗
地址：	100085 北京市***	國省代碼：	北京;11
權利要求書：	查看更多	說明書：	查看更多
摘要：
搜索關鍵詞：	用于錄制音頻方法裝置設備介質
鉆瓜網技術展會專利詞庫專利權人專利榜在售專利公布日期熱門專利

【說明書】：

本公開提供了一種錄制音頻的方法及裝置、計算設備和介質，涉及人工智能技術領域，尤其涉及語音測試集的錄制。實現方案為：控制錄音設備錄制音頻片段集合；對音頻片段集合中的至少一個音頻片段中的每個音頻片段執行操作，操作包括：基于與該音頻片段相對應的第一時間和第二時間以及聲音在預定距離上的傳播時延，標注該音頻片段的音頻在該音頻片段內的開始時間；以及基于與該音頻片段相對應的第一時間和第四時間、預定超時時間以及傳播時延，標注該音頻片段的音頻在該音頻片段內的結束時間。

技術領域

本公開涉及人工智能技術領域，尤其涉及語音測試集的錄制。具體地，本公開提供了一種音頻錄制方法、裝置、電子設備、計算機可讀存儲介質和計算機程序產品。

背景技術

錄制音頻的過程，主要的步驟是語音錄制、語音標注及測試集音頻質量，并且三個步驟按次序依次獨立進行。即首先進行語音錄制，錄制完成后需要人工進行聽音并進行時間標注(標注人聲的起始時間位置及發聲的內容)，最后進行人工音頻質量檢測。最后完成一個完整的音頻錄制過程。

現有的音頻錄制過程中，在進行時間標注時全部依靠人工進行，這就會帶來錄制效率低以及時間標注誤差偏大的問題。同時通過人工進行的音頻質量檢查也會帶來音頻錄制的效率低、周期長、容易出錯等問題。

發明內容

本公開提供了一種用于錄制音頻的方法、裝置、電子設備、計算機可讀存儲介質和計算機程序產品。

根據本公開的一方面，提供了一種用于錄制音頻的方法，包括：控制錄音設備錄制音頻片段集合，其中，音頻片段集合中的每個音頻片段的錄制包括：響應于接收到來自錄音控制器的錄制開始信號，記錄接收到錄制開始信號時的第一時間，并控制錄音設備開始錄制；響應于接收到來自錄音控制器的指示音頻已開始的音頻開始信號，記錄接收到音頻開始信號時的第二時間，其中，音頻從與錄音設備相距預定距離的聲源發出；響應于接收到來自錄音控制器的指示音頻已結束的音頻結束信號，記錄接收到音頻結束信號時的第三時間，并在第三時間之后等待預定超時時間；以及響應于在預定超時時間內未再接收到音頻開始信號和音頻結束信號中的任一個，記錄預定超時時間到期時的第四時間；以及對音頻片段集合中的至少一個音頻片段中的每個音頻片段執行操作，包括：基于與該音頻片段相對應的第一時間和第二時間以及聲音在預定距離上的傳播時延，標注該音頻片段的音頻在該音頻片段內的開始時間；以及基于與該音頻片段相對應的第一時間和第四時間、預定超時時間以及傳播時延，標注該音頻片段的音頻在該音頻片段內的結束時間。

根據本公開的一方面，提供了一種用于錄制音頻的方法，包括：響應于接收到指示開始錄制音頻的用戶操作，向中央控制器發送錄制開始信號，以使得中央控制器控制錄音設備開始錄制；利用聲音拾取設備在聲源處采集音頻信號，其中，聲源與錄音設備相距預定距離；執行音頻開始檢測，音頻開始檢測包括：從采集到的音頻信號中檢測目標音頻；響應于確定目標音頻滿足預定條件，向中央控制器發送音頻開始信號；以及響應于確定目標音頻不滿足預定條件，繼續目標音頻的檢測；以及響應于已發送音頻開始信號，執行音頻結束檢測，音頻結束檢測包括：從采集到的音頻信號中檢測目標音頻；響應于確定目標音頻滿足預定條件，繼續目標音頻的檢測；以及響應于確定目標音頻不滿足預定條件，向中央控制器發送音頻結束信號；以及響應于已發送音頻結束信號，繼續執行音頻開始檢測。

下載完整專利技術內容需要扣除積分，VIP會員可以免費下載。

免登錄下載普通用戶下載升級VIP會員，免費下載

該專利技術資料僅供研究查看技術是否侵權等信息，商用須獲得專利權人授權。該專利全部權利屬于北京百度網訊科技有限公司，未經北京百度網訊科技有限公司許可，擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作，請聯系【客服】

本文鏈接：http://www.szxzyx.cn/pat/books/202110870066.6/2.html，轉載請聲明來源鉆瓜專利網。