[發明專利]文本檢索字幕庫生成方法和裝置、視頻檢索方法和裝置有效
| 申請號: | 201410244830.9 | 申請日: | 2014-06-04 |
| 公開(公告)號: | CN103984772B | 公開(公告)日: | 2017-07-18 |
| 發明(設計)人: | 韓鈞宇 | 申請(專利權)人: | 百度在線網絡技術(北京)有限公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 北京品源專利代理有限公司11332 | 代理人: | 鄧猛烈,孟金喆 |
| 地址: | 100085 北京市*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 文本 檢索 字幕 生成 方法 裝置 視頻 | ||
1.一種文本檢索字幕庫的生成方法,其特征在于,包括:
根據預設的語種類型,獲取與視頻對應的至少兩個語種類型的語種檢索字幕,其中,所述語種檢索字幕存儲于至少一個字幕文件中;
將視頻庫中與各視頻對應的語種檢索字幕的合集,作為文本檢索字幕庫;
其中,所述根據預設的語種類型,獲取與視頻對應的至少兩個語種類型的語種檢索字幕包括:
根據預設的語種類型,獲取與視頻對應的至少一個語種類型的視頻字幕;
如果獲取的所述視頻字幕的語種類型數目等于預設的語種類型數目,將獲取的所述視頻字幕作為所述視頻的語種檢索字幕;
如果獲取的所述視頻字幕的語種類型數目小于預設的語種類型數目,使用獲取的所述視頻字幕,生成與未被獲取的預設語種類型對應的翻譯字幕;
將生成的所述翻譯字幕和獲取的所述視頻字幕的合集作為所述視頻的語種檢索字幕;
所述如果獲取的所述視頻字幕的語種類型數目小于預設的語種類型數目,使用獲取的所述視頻字幕,生成未被獲取的預設語種類型的翻譯字幕包括:
計算獲取的所述視頻字幕的語種類型與未被獲取的預設語種類型的易翻譯權值;
使用自動翻譯工具,對與未被獲取的預設語種類型易翻譯權值最高的視頻字幕進行翻譯,生成與未被獲取的預設語種類型對應的翻譯字幕;
所述根據預設的語種類型,獲取與視頻對應的至少一個語種類型的視頻字幕包括:
根據預設的語種類型,獲取視頻自帶的獨立字幕文件;
如果未通過獲取視頻自帶的獨立字幕文件的方式獲取與視頻對應的至少一個語種類型的視頻字幕,則根據預設的語種類型,使用光學字符識別技術,識別所述視頻的圖像中展示的字幕文字內容;
如果未通過所述光學字符識別技術獲取與視頻對應的至少一個語種類型的視頻字幕,則根據預設的語種類型,在互聯網中搜索與所述視頻的標簽信息相匹配的網絡字幕文件,作為所述視頻字幕。
2.一種視頻的檢索方法,其特征在于,包括:
獲取文本檢索字幕庫中與輸入檢索詞對應的至少一個匹配字幕語句集,其中,所述匹配字幕語句集中包括至少一個字幕語句;
根據所述匹配字幕語句集獲取對應的視頻信息,作為所述輸入檢索詞的檢索結果;
其中,所述文本檢索字幕庫包括至少一個字幕文件,所述字幕文件用于存儲與視頻對應的至少兩個語種類型的語種檢索字幕;
所述根據所述匹配字幕語句集獲取對應的視頻信息包括:
將所述匹配字幕語句集,作為所述視頻信息,提供給用戶;以及
將與所述匹配字幕語句集對應的視頻圖像幀集合,作為所述視頻信息,提供給用戶,其中,所述視頻圖像幀集合中包括至少一個視頻圖像幀;
其中,在最初狀態下只向用戶提供匹配字幕語句集,當用戶選擇一個匹配字幕語句后,將對應的視頻圖像幀提供給用戶。
3.根據權利要求2所述的方法,其特征在于,所述獲取文本檢索字幕庫中與輸入檢索詞對應的至少一個匹配字幕語句集還包括:
在所述文本檢索字幕庫的字幕文件中獲取與所述輸入檢索詞的語種類型相匹配的至少一個字幕語句,并計算所述至少一個字幕語句與所述輸入檢索詞的相似度權重值;
在相似度權重值大于預定閾值的匹配字幕語句所在的字幕文件中,獲取包括所述匹配字幕語句的匹配字幕語句集。
4.根據權利要求2所述的方法,其特征在于,所述獲取文本檢索字幕庫中與輸入檢索詞對應的至少一個匹配字幕語句集包括:
在所述文本檢索字幕庫的字幕文件中獲取與所述輸入檢索詞的語種類型相匹配的至少一個字幕語句,并計算所述至少一個字幕語句與所述輸入檢索詞的第一相似權值;
在所述文本檢索字幕庫的字幕文件中獲取與所述相匹配的至少一個字幕語句不同語種類型的至少一個驗證字幕語句;
使用自動翻譯工具,將所述輸入檢索詞翻譯為與所述驗證字幕語句的語種類型相同的翻譯檢索詞;
計算所述至少一個驗證字幕語句與所述翻譯檢索詞的第二相似權值;
根據所述第一相似權值與所述第二相似權值,計算所述相匹配的至少一個字幕語句的相似度權重值;
在相似度權重值大于預定閾值的匹配字幕語句所在的字幕文件中,獲取包括所述匹配字幕語句的匹配字幕語句集。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于百度在線網絡技術(北京)有限公司,未經百度在線網絡技術(北京)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201410244830.9/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:輔助收縮肌肉的電療裝置
- 下一篇:地下含水層測試模擬裝置





