[發明專利]語音文件的LRC時間軸文件自動生成方法及相關設備有效
| 申請號: | 201710042000.1 | 申請日: | 2017-01-20 |
| 公開(公告)號: | CN106897379B | 公開(公告)日: | 2019-12-03 |
| 發明(設計)人: | 涂繼宏 | 申請(專利權)人: | 廣東小天才科技有限公司 |
| 主分類號: | G06F16/44 | 分類號: | G06F16/44;G10L21/02 |
| 代理公司: | 44381 廣州德科知識產權代理有限公司 | 代理人: | 萬振雄<國際申請>=<國際公布>=<進入 |
| 地址: | 523859 廣東省東*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 語音 文件 lrc 時間 自動 生成 方法 相關 設備 | ||
本發明實施例公開一種語音文件的LRC時間軸文件自動生成方法及相關設備,該方法包括:當沒有處理完所有的語音文件時,獲取未經處理的語音文件及相應的錄音稿文件;然后按照語音文件的語句間隔將語音文件分成多個語音區間,并記錄每個語音區間的開始時間;再依據語音識別技術識別語音文件,生成與該語音文件對應的文本文件,其中,文本文件記錄了與語音區間對應的文本的開始時間;最后將文本文件與錄音稿文件進行對比,并生成LRC時間軸文件。可見,實施本發明實施例,能夠智能地生成語音文件的LRC時間軸文件,省去了大量的人工工作,提高了效率,降低了成本。
技術領域
本發明涉及多媒體技術領域,尤其涉及一種語音文件的LRC時間軸文件自動生成方法及相關設備。
背景技術
目前對于學習終端或者家教終端中的英語聽說或者有聲教材模塊使用的數據均是教材同步課文的語音和對應的文字數據,也即常用的MP3+LRC的形式。對同步于語音文件的文本數據,目前的制作方法中,需要完全人工進行拆分、文字識別、對文本數據進行語音錄制、制作時間軸文件、人工校對等等,制作方式步驟多,制作效率比較低、耗時長、制作成本代價高。
發明內容
本發明實施例公開了一種語音文件的LRC時間軸文件自動生成方法及相關設備,大大提高了制作LRC時間軸文件的效率。
本發明實施例第一方面公開一種語音文件的LRC時間軸文件自動生成方法,包括:
當沒有處理完所有的語音文件時,獲取未經處理的語音文件及相應的錄音稿文件;
按照所述語音文件的語句間隔將所述語音文件分成多個語音區間,并記錄每個語音區間的開始時間;
依據語音識別技術識別所述語音文件,生成與所述語音文件對應的文本文件,其中,所述文本文件記錄與所述語音區間對應的開始時間;
將所述文本文件與所述錄音稿文件進行對比,并生成LRC時間軸文件。
作為一種可選的實施方式,在本發明實施例第一方面中,所述方法中將文本文件與所述錄音稿文件進行對比,并生成LRC時間軸文件的步驟包括:
判斷是否已經讀取完所述錄音稿文件的文本或者已經讀取完文本文件的文本,如果沒有讀取完,則按預設的單位長度依次讀取所述錄音稿文件的文本,并將讀取的文本與所述文本文件的語音區間對應的文本進行對比,若相似度小于預設的閥值,則讀取文本文件的下一個單位長度文本并與錄音稿文件進行對比,直到相似度達到預設的閥值;再將所述語音區間對應的文本的開始時間與讀取的錄音稿文件寫入LRC時間軸文件;如果讀取完所述錄音稿文件的文本或者讀取完文本文件的文本,生成整個語音文件對應的LRC時間軸文件。
作為一種可選的實施方式,在本發明實施例第一方面中,所述按照語音文件的語句間隔將所述語音文件分成多個語音區間,并記錄每個語音區間的開始時間的步驟之后,所述方法還包括:
依據語種識別技術識別出各語音區間音頻發音的語言種類;
再根據識別的語言種類調用對應的語音識別接口進行語音識別,生成與所述語音文件對應的文本文件。
作為一種可選的實施方式,在本發明實施例第一方面中,所述獲取未經處理的語音文件及相應的錄音稿文件的步驟之后,所述方法還包括:
按預設的降噪值和音頻分貝值對所述語音文件進行預處理,從而提升語音識別成文本的精度。
作為一種可選的實施方式,在本發明實施例第一方面中,所述生成LRC時間軸文件的步驟之后,所述方法還包括:
將所述語音文件與所述LRC時間軸文件加密打包生成用戶設備使用的數據。
本發明實施例第二方面公開一種語音文件的LRC時間軸文件自動生成裝置,包括:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于廣東小天才科技有限公司,未經廣東小天才科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710042000.1/2.html,轉載請聲明來源鉆瓜專利網。





