[發明專利]一種多設備錄音的自動切分對齊方法有效
| 申請號: | 201711284222.0 | 申請日: | 2017-12-07 |
| 公開(公告)號: | CN108021675B | 公開(公告)日: | 2021-11-09 |
| 發明(設計)人: | 吳妍;鄭羲光 | 申請(專利權)人: | 北京慧聽科技有限公司 |
| 主分類號: | G06F16/683 | 分類號: | G06F16/683;G06F16/61 |
| 代理公司: | 天津市三利專利商標代理有限公司 12107 | 代理人: | 韓新城 |
| 地址: | 100107 北京市朝陽*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 設備 錄音 自動 切分 對齊 方法 | ||
本發明公開一種多設備錄音的自動切分對齊方法,包括步驟:將不同形式的多個原始錄音對應處理成同一格式的多個長時錄音;將多個所述長時錄音中所包含的相同長時錄音進行關聯;利用短時參考錄音對相關聯的長時錄音分別進行對齊,然后切分成與所述短時參考錄音對應的短時錄音。本發明解決了錄制多設備語音識別數據庫的數據處理中復雜的問題。
技術領域
本發明涉及語音識別數據庫制作技術領域,涉及一種多設備錄音的自動切分對齊方法。
背景技術
在語音識別數據庫制作過程中,通過利用多設備同時采集錄音,可大幅提高錄音的效率和多樣性。例如,通過在錄音中同時采集頭戴麥克風、手機和麥克風陣列的信號,可保證信道的多樣性,進而提高識別數據庫的實用性,使得數據庫可在遠場識別、喚醒、降噪等應用中使用。由于同時存在近講、遠講的對應數據,可方便評估遠場識別、喚醒、降噪算法的性能。
然而在多設備錄音采集的過程中,由于錄音設備不同,各錄音設備無法在時間上同時開始錄音(即同時按下錄音開關或發出錄音命令);部分錄音設備的錄音丟幀問題和錄音過程中的操作失誤,給語音識別數據的后期處理帶來一定挑戰。
發明內容
本發明的目的是針對現有技術中存在的技術缺陷,而提供一種用于語音識別數據庫制作的多設備錄音的自動切分對齊方法,通過以短時參考錄音作為參考,實現自動分別地多個目標錄音中的關聯錄音對齊,然后切分形成對應的短時錄音存儲在語音識別數據庫中,從而實現將不同原始錄音轉化為語音識別系統可使用的短時錄音。
為實現本發明的目的所采用的技術方案是:
一種多設備錄音的自動切分對齊方法,包括步驟:
將不同形式的多個原始錄音對應處理成同一格式的多個長時錄音;
將多個所述長時錄音中所包含的相同長時錄音進行關聯;
利用短時參考錄音對相關聯的長時錄音分別進行對齊,然后切分成與所述短時參考錄音對應的短時錄音。
本發明中,所述長時錄音是指不同錄音設備自其錄音開始時刻至結束時刻不間斷采集的全部錄音,包括有效錄音與無效錄音;所述短時錄音指自所述長時錄音中切分出的有效錄音。
本發明中,所述原始錄音包括原始短時錄音與原始長時錄音,分別通過以下步驟形成所述長時錄音;
對原始長時錄音,則在原始長時錄音解壓后進行統一格式轉換,并按統一采樣率對原始長時錄音重新采樣,從而形成所述長時錄音;
對原始短時錄音,則在原始短時錄音解壓后進行統一格式轉換,并按統一采樣率對原始短時錄音重新采樣后,將原始短時錄音根據時間戳拼接成所述長時錄音。
其中,利用短時參考錄音對多個相關聯的長時錄音分別進行對齊,可以是采用在多個所述相關聯的長時錄音中分別搜索短時參考錄音來實現。
進一步的,利用短時參考錄音對多個相關聯的長時錄音分別進行對齊,還可以采用下方式實現:
分別截取相關聯的長時錄音和短時參考錄音的頭尾兩段,計算相關聯的長時錄音和短時參考錄音在錄音開始階段、結束階段的錄音偏移;
根據所述錄音偏移獲取短時參考錄音在相關聯的長時錄音中的位置,然后利用該短時參考錄音在相關聯的長時錄音中切出對應的短錄音。
具體的,所述錄音偏移的計算,可在原始時域信號上計算,或是在降噪后的時域信號上計算,或是在信號特征的域上計算。
其中,所述短時參考錄音可以是對參考錄音設備錄制的長時參考錄音切分而形成,或是參考錄音設備直接錄制的短時錄音。
所述對參考錄音設備錄制的長時參考錄音切分,是利用語音活動檢測信息進行切分的。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京慧聽科技有限公司,未經北京慧聽科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201711284222.0/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:蛋白分析設備
- 下一篇:物體平面尺寸測量方法和系統





