[發明專利]視頻文件錄制方法、音頻文件錄制方法及移動終端在審
| 申請號: | 201710525908.8 | 申請日: | 2017-06-30 |
| 公開(公告)號: | CN107316642A | 公開(公告)日: | 2017-11-03 |
| 發明(設計)人: | 張雨田 | 申請(專利權)人: | 聯想(北京)有限公司 |
| 主分類號: | G10L15/22 | 分類號: | G10L15/22;G10L15/26;G10L21/0208;H04N5/76;H04N21/43;H04N21/431;H04N21/488 |
| 代理公司: | 北京集佳知識產權代理有限公司11227 | 代理人: | 王寶筠 |
| 地址: | 100085 北京市*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 視頻文件 錄制 方法 音頻文件 移動 終端 | ||
技術領域
本申請屬于多媒體技術領域,尤其涉及視頻文件錄制方法、音頻文件錄制方法及移動終端。
背景技術
隨著互聯網技術的發展和互聯網資源的日益豐富,用戶通過互聯網能夠獲取到多種用于工作、學習、娛樂的資源,音頻和視頻就是其中重要的資源。
為了給用戶帶來更加豐富的體驗,音頻和視頻通常配有對應的字幕,便于有聽覺障礙的用戶或者處于嘈雜環境的用戶通過字幕清楚地理解音頻和視頻所播放的內容。目前通常是先制作音頻或者視頻,后期再制作對應的字幕。但是,目前針對音頻或者視頻制作字幕的方式較為單一。
發明內容
有鑒于此,本申請的目的在于提供一種應用于移動終端的視頻文件錄制方法,以便更加快捷地制作完成配置有字幕的視頻文件。本申請還提供一種應用于移動終端的音頻文件錄制方法,以便更加快捷地制作完成配置有字幕的音頻文件。
為實現上述目的,本申請提供如下技術方案:
一方面,本申請提供一種移動終端的視頻文件錄制方法,包括:
獲得指示開始錄制視頻的第一指令;
響應所述第一指令,進入視頻錄制模式;
在所述視頻錄制模式下,通過所述移動終端的攝像頭獲得圖像信息,通過所述移動終端的麥克風獲得音頻信息;
調用語音識別引擎,基于所述語音識別引擎對所述音頻信息進行實時處理,以使得基于所述音頻信息同步生成字幕信息;
獲得指示結束錄制視頻的第二指令;
響應所述第二指令,退出所述視頻錄制模式;
將在所述視頻錄制模式下,由所述圖像信息構成的圖像流、由所述音頻信息構成的音頻流、以及由所述字幕信息構成的字幕流合成為第一視頻文件,以使得在播放所述第一視頻文件時,同步輸出所述圖像流、所述音頻流和所述字幕流。
可選的,上述方法中,所述基于所述語音識別引擎對所述音頻信息進行實時處理,包括:基于所述音頻信息的參數信息確定當前錄制環境;基于當前錄制環境為所述第一環境的結果,將當前的音頻信息同步轉換為字幕信息;基于當前錄制環境為所述第二環境的結果,暫停將音頻信息同步轉換為字幕信息的操作,直至獲得表明當前錄制環境為所述第一環境的結果。
可選的,上述方法中,所述第一環境為至少有一個用戶在進行語言輸出的環境,所述第二環境為僅存在背景音的環境。
可選的,上述方法中,基于所述音頻信息的參數信息確定當前錄制環境,包括:確定當前音頻信息的信噪比;如果當前音頻信息的信噪比大于閾值,則確定當前錄制環境為所述第一環境;如果當前音頻信息的信噪比小于所述閾值,則確定當前錄制環境為所述第二環境。
可選的,所述移動終端包括麥克風陣列,所述麥克風陣列包括多個安裝位置不同的麥克風,其中,所述攝像頭所在的側面上設置有至少一個麥克風,所述移動終端的至少一個其他側面上設置有麥克風;
上述方法中,所述通過所述移動終端的麥克風獲得音頻信息,包括:通過所述麥克風陣列獲得目標用戶的音頻信息,其中,所述目標用戶為能夠通過所述移動終端的攝像頭進行圖像采集且顯示在所述移動終端的顯示屏內的用戶。
另一方面,本申請提供一種移動終端,包括輸入接口、攝像頭、麥克風和處理器;
所述輸入接口用于采集輸入指令;
所述處理器用于:響應指示開始錄制視頻的第一指令,進入視頻錄制模式;在所述視頻錄制模式下,通過所述移動終端的攝像頭獲得圖像信息,通過所述移動終端的麥克風獲得音頻信息;調用語音識別引擎,基于所述語音識別引擎對所述音頻信息進行實時處理,以使得基于所述音頻信息同步生成字幕信息;響應指示結束錄制視頻的第二指令,退出所述視頻錄制模式;將在所述視頻錄制模式下,由所述圖像信息構成的圖像流、由所述音頻信息構成的音頻流、以及由所述字幕信息構成的字幕流合成為第一視頻文件,以使得在播放所述第一視頻文件時,同步輸出所述圖像流、所述音頻流和所述字幕流。
可選的,上述移動終端中,所述處理器在基于所述語音識別引擎對所述音頻信息進行實時處理的方面,用于:
基于所述音頻信息的參數信息確定當前錄制環境;基于當前錄制環境為所述第一環境的結果,將當前的音頻信息同步轉換為字幕信息;基于當前錄制環境為所述第二環境的結果,暫停將音頻信息同步轉換為字幕信息的操作,直至獲得表明當前錄制環境為所述第一環境的結果。
可選的,上述移動終端中,所述處理器將所述第一環境配置為至少有一個用戶在進行語言輸出的環境,將所述第二環境配置為僅存在背景音的環境。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于聯想(北京)有限公司,未經聯想(北京)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710525908.8/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:層疊體的制造方法以及層疊體
- 下一篇:一種板材切割機用開關裝置





