[發明專利]音頻語料自動標注方法、系統、介質和電子設備在審
| 申請號: | 202010046552.1 | 申請日: | 2020-01-16 |
| 公開(公告)號: | CN111274434A | 公開(公告)日: | 2020-06-12 |
| 發明(設計)人: | 袁鵬;江文斌;李健 | 申請(專利權)人: | 上海攜程國際旅行社有限公司 |
| 主分類號: | G06F16/683 | 分類號: | G06F16/683;G10L15/04;G10L15/26 |
| 代理公司: | 上海弼興律師事務所 31283 | 代理人: | 薛琦;張冉 |
| 地址: | 200335 上海市*** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 音頻 語料 自動 標注 方法 系統 介質 電子設備 | ||
1.一種音頻語料自動標注方法,其特征在于,包括:
S1、從一音頻庫里抓取一音頻文件;
S2、轉換所述音頻文件的格式;
S3、通過VAD方法將所述音頻文件切割為多個音頻片段;
S4、調用語音識別API對多個音頻片段進行識別,以獲得一識別文本;
S5、抓取所述音頻文件對應的原始文本,并將所述識別文本與所述原始文本進行對比,并根據對比的結果對所述音頻文件進行標注。
2.如權利要求1所述的音頻語料自動標注方法,其特征在于,步驟S3和步驟S4之間包括:
S3a、判斷所述音頻片段的時長是否在一預設范圍內,若是,則進入步驟S4;若否,則對該音頻片段重新切割。
3.如權利要求1所述的音頻語料自動標注方法,其特征在于,步驟S3包括:
S31、通過比較似然比的方法判斷所述音頻文件是否為語音,并對所述音頻文件為語音以及為非語音的情形分別進行標注。
4.如權利要求1-3中任意一項所述的音頻語料自動標注方法,其特征在于,步驟S5中將所述識別文本與所述原始文本進行對比的方法為:基于Python中gensim模塊計算相似度,或者通過Levenshtein距離法計算相似度。
5.一種音頻語料自動標注系統,其特征在于,包括:
音頻抓取模塊,用于從一音頻庫里抓取一音頻文件;
格式轉換模塊,用于轉換所述音頻文件的格式;
切割模塊,用于通過VAD方法將所述音頻文件切割為多個音頻片段;
識別模塊,用于調用語音識別API對多個音頻片段進行識別,以獲得一識別文本;
對比模塊,用于抓取所述音頻文件對應的原始文本,并將所述識別文本與所述原始文本進行對比,并根據對比的結果對所述音頻文件進行標注。
6.一種計算機可讀存儲介質,其上存儲有計算機程序,其特征在于,所述計算機程序被處理器執行時實現權利要求1-4中任意一項所述的音頻語料自動標注方法的步驟。
7.一種電子設備,包括存儲器,處理器及存儲在存儲器上并可在處理器上運行的計算機程序,其特征在于,所述處理器執行所述計算機程序時實現權利要求1-4中任意一項所述的音頻語料自動標注方法的步驟。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于上海攜程國際旅行社有限公司,未經上海攜程國際旅行社有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010046552.1/1.html,轉載請聲明來源鉆瓜專利網。





