[發明專利]一種視頻翻譯方法及其系統有效
| 申請號: | 201710788576.2 | 申請日: | 2017-09-05 |
| 公開(公告)號: | CN107688792B | 公開(公告)日: | 2020-06-05 |
| 發明(設計)人: | 鄭麗華 | 申請(專利權)人: | 語聯網(武漢)信息技術有限公司 |
| 主分類號: | G06K9/00 | 分類號: | G06K9/00;G06F16/783 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 430073 湖北省武漢市東湖開發區光谷軟件*** | 國省代碼: | 湖北;42 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 視頻 翻譯 方法 及其 系統 | ||
1.一種基于聲音流的視頻翻譯方法,包括如下步驟:
(1)導入待翻譯的視頻文件;
(2)對所述待翻譯的視頻文件進行自動分割,得到多個視頻分割子文件;
(3)選擇所述多個視頻分割子文件中需要翻譯的視頻分割子文件進行翻譯;
(4)將每一個需要翻譯的視頻分割子文件的翻譯結果與該需要翻譯的視頻分割子文件進行關聯,得到多個關聯存儲對;
(5)將步驟(2)中自動分割得到的多個視頻分割子文件中不需要進行翻譯的視頻分割子文件,與步驟(4)得到的多個關聯存儲對組合,得到所述待翻譯的視頻文件的翻譯結果;
其特征在于:
對所述待翻譯的視頻文件進行自動分割,得到多個視頻分割子文件,主要包括:針對單個的影視視頻,采用視頻分割算法,識別出其中的片頭部分、片尾部分并將其分割出來,從而將視頻至少分成三部分:片頭部分、片尾部分和除片頭片尾之外的正文視頻部分;
針對所述正文視頻部分,識別其中的聲音流,開始檢測聲音流的初始起始點、中間停頓點、中間起始點和結束點;
所述初始起始點是指該視頻文件第一次檢測到聲音流的時間點;
所述中間停頓點是指所述視頻文件在該點之后的第一預設時間段內存在播放畫面,但是未檢測到聲音流;
所述中間起始點是指自前述中間停頓點之后,再次檢測到聲音流文件的點;
所述結束點是指該視頻文件最后一次檢測到聲音流的時間點;其中,所述中間停頓點、中間起始點均有多個。
2.如權利要求1所述的方法,進一步包括:針對所述正文視頻部分,識別其中的聲音流文件;根據所述聲音流文件將所述正文視頻劃分為多個視頻分割子文件。
3.如權利要求1-2任一項所述的方法,其特征在于:所述需要翻譯的視頻分割子文件,是指該視頻分割子文件中包含需要翻譯的聲音。
4.一種視頻翻譯系統,所述視頻翻譯系統用于執行權利要求1-3任一項所述的視頻翻譯方法,其特征在于,該視頻翻譯系統包括:
視頻導入模塊,用于導入待翻譯的視頻文件;
視頻分割模塊,對所述待翻譯的視頻文件進行自動分割,輸出多個視頻分割子文件;
判斷模塊,判斷所述視頻分割模塊輸出的視頻分割子文件是否需要翻譯;
選擇模塊,選擇所述多個視頻分割子文件中需要翻譯的視頻分割子文件;
翻譯模塊,對所述選擇模塊選擇的視頻分割子文件進行翻譯;
存儲模塊,將每一個需要翻譯的視頻分割子文件的翻譯結果與該需要翻譯的視頻分割子文件進行關聯,得到多個關聯存儲對;
結果生成模塊,將判斷模塊判斷出的不需要進行翻譯的視頻分割子文件,與存儲模塊得到的多個關聯存儲對組合,生成所述待翻譯的視頻文件的翻譯結果。
5.如權利要求4所述的系統,其中,所述判斷模塊,判斷所述視頻分割模塊輸出的視頻分割子文件是否需要翻譯,具體包括:判斷視頻分割子文件中是否包含需要翻譯的聲音。
6.一種計算機可讀介質,其存儲有可通過計算機存儲器和處理器可執行的指令;所述存儲器和處理器執行所述可執行的指令,用于實現如權利要求1-3任一項所述的方法。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于語聯網(武漢)信息技術有限公司,未經語聯網(武漢)信息技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710788576.2/1.html,轉載請聲明來源鉆瓜專利網。





