[發明專利]從音頻文件中提取有聲片段的方法、裝置設備及存儲介質有效
| 申請號: | 201911206708.1 | 申請日: | 2019-11-29 |
| 公開(公告)號: | CN110910863B | 公開(公告)日: | 2023-01-31 |
| 發明(設計)人: | 張天祥;范磊;楊麗濤 | 申請(專利權)人: | 上海依圖信息技術有限公司 |
| 主分類號: | G10L15/04 | 分類號: | G10L15/04;G10L25/78 |
| 代理公司: | 上海恒慧知識產權代理事務所(特殊普通合伙) 31317 | 代理人: | 徐紅銀 |
| 地址: | 200126 上海市*** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 音頻文件 提取 有聲 片段 方法 裝置 設備 存儲 介質 | ||
本發明提供一種從音頻文件中提取有聲片段的方法、裝置、設備及存儲介質。其中,該方法包括:獲取待處理音頻文件;對所述待處理音頻文件進行分割,得到多個音頻片段;對每個所述音頻片段進行語音識別處理,得到語音識別結果;基于所述語音識別結果判斷有聲片段并提取所述有聲片段。本發明解決了處理長音頻文件的效率低下等問題,提高了長音頻文件中有聲片段的定位效率和定位的準確性,以實現快速有效地從長音頻文件中提取有聲片段,節約時間,提高工作效率。
技術領域
本發明涉及語音識別領域,尤其涉及一種從音頻文件中提取有聲片段的方法、裝置、設備及計算機可讀存儲介質。
背景技術
隨著語音識別技術日趨成熟,語音識別技術已經被廣泛應用于各個行業領域,伴隨各種領域語音識別軟件的出現,用戶可以通過語音識別軟件,將語音轉換為相應的文字,使得用戶無需再手動輸入文字,給用戶的生活和工作帶來很大的便利。
在處理長音頻文件時,一般為了避免遺漏內容,會選擇從頭到尾完整聽一遍音頻文件,這樣會花費大量時間,而長音頻文件中往往包含大量冗余空白內容,這些空白內容音頻不屬于有效內容,耗費時間浪費人力,針對處理長音頻文件的效率低下等問題,目前尚未提出有效的解決方案。
發明內容
有鑒于此,本發明提供一種從音頻文件中提取有聲片段的方法、裝置、設備及計算機可讀存儲介質,能夠快速有效地在長音頻文件中提取有用的音頻文件,節約時間,提高工作效率。
為解決上述技術問題,一方面,本發明實施例提供一種從音頻文件中提取有聲片段的方法,包括:
獲取待處理音頻文件;對所述待處理音頻文件進行分割,得到多個音頻片段,可以按照時間大小或音頻片段的大小進形切分;對每個所述音頻片段進行語音識別處理,得到語音識別結果,識別結果包括每個音頻片段的有聲片段和無聲片段,并在有聲片段中得到語音信號或文字信息等,對多個音頻片段的識別結果合并,以得到音頻片段的完整的語音識別結果,其中可以采用語音端點檢測技術(VAD)對每一個音頻片段從帶有噪聲的語音中準確的定位出語音的開始和結束點,以對音頻片段去除靜音(無聲片段)和噪音,以能夠精準的對有聲片段進行定位,基于所述語音識別結果判斷有聲片段并提取所述有聲片段。
根據本申請的實施例,提高了長音頻文件中有聲片段的定位效率和定位的準確性,以實現快速有效地從長音頻文件中提取有聲片段,節約時間,提高工作效率。
在本申請第一方面的一個實施例中,所述語音識別結果包括以字為單位的文本,以及每個字在音頻文件中的偏移位置。通過確定每個字在音頻片段中的位置可以有效的提取該文本,以提高有聲片段提取的速度。
在本申請第一方面的一個實施例中,在得到多個音頻片段后攢批進行所述語音識別處理,得到各個批次的所述語音識別結果。也就是說,由于在音頻片段中可能有大量的無聲音的片段,因此通過積攢大批量音頻片段并進行的語音識別處理,可以提高處理結果,并能夠快速分析長音頻文件的內容。
在本申請第一方面的一個實施例中,對于各個批次的所述語音識別進行排序合并處理,得到排序后的完整的所述語音識別結果,可以完整識別長音頻文件的內容并排序。
在本申請第一方面的一個實施例中,基于所述語音識別結果判斷有聲片段并提取,具體包括:從頭開始遍歷所述語音識別結果,并基于所述語音識別結果是否存在文本判斷當前音頻片段是否有聲;當所述語音識別結果中存在文本時判斷為當前的音頻片段有聲;根據該文本中的首字的偏移位置,記錄有聲片段的開始位置;繼續遍歷所述文本,直至出現一個不存在文本的音頻片段,以上一個音頻片段中的文本中最后一個字所對應的偏移位置作為該有聲片段的結束位置;重復上述步驟,直至針對所述語音識別結果均已判斷完畢,得到所述有聲片段并提取。由此,可以快速有效地分析長音頻文件,找到所有包含有效內容的音頻文件片段。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于上海依圖信息技術有限公司,未經上海依圖信息技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201911206708.1/2.html,轉載請聲明來源鉆瓜專利網。





