[發明專利]一種視頻標簽的生成方法、裝置及計算機存儲介質有效
| 申請號: | 201810273066.6 | 申請日: | 2018-03-29 |
| 公開(公告)號: | CN110555136B | 公開(公告)日: | 2022-07-08 |
| 發明(設計)人: | 盛驍杰 | 申請(專利權)人: | 阿里巴巴(中國)有限公司 |
| 主分類號: | G06F16/78 | 分類號: | G06F16/78 |
| 代理公司: | 北京三友知識產權代理有限公司 11127 | 代理人: | 李輝;陳剛 |
| 地址: | 311121 浙江省杭州市余杭*** | 國省代碼: | 浙江;33 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 視頻 標簽 生成 方法 裝置 計算機 存儲 介質 | ||
1.一種視頻標簽的生成方法,其特征在于,提供有標簽庫,所述標簽庫中包括視頻標簽以及所述視頻標簽關聯的描述詞匯組,所述描述詞匯組中包括至少兩個描述詞匯,所述方法包括:
獲取目標視頻的視頻信息,所述視頻信息中包括所述目標視頻的語音信息、圖像信息、字幕信息以及標題信息;
根據在所述目標視頻中處于同一場景下的視頻信息識別得到特征詞匯組,所述特征詞匯組中包括用于表征所述目標視頻的內容的特征詞匯;
確定所述特征詞匯組中包含的描述詞匯組,并將確定的所述描述詞匯組在所述標簽庫中關聯的視頻標簽作為所述目標視頻的視頻標簽;所述確定所述特征詞匯組中包含的描述詞匯組包括:在所述標簽庫中查詢與所述特征詞匯組中的特征詞匯相匹配的描述詞匯,并判斷查詢得到的所述描述詞匯中是否存在處于同一個目標描述詞匯組中的描述詞匯;若存在,判斷查詢得到的所述描述詞匯中處于所述目標描述詞匯組中的描述詞匯的數量是否達到所述目標描述詞匯組中包含的描述詞匯的標準數量;若達到,將所述目標描述詞匯組作為所述特征詞匯組中包含的描述詞匯組。
2.根據權利要求1所述的方法,其特征在于,根據在所述目標視頻中處于同一場景下的視頻信息識別得到特征詞匯組包括:
從所述目標視頻中依次提取場景切換幀,并將相鄰兩個場景切換幀之間的視頻幀作為相同場景幀;
從所述相同場景幀對應的視頻信息中識別表征所述相同場景幀的內容的多個特征詞匯;其中,所述多個特征詞匯構成所述相同場景幀對應的特征詞匯組。
3.根據權利要求2所述的方法,其特征在于,從所述目標視頻中依次提取場景切換幀包括:
在所述目標視頻中確定基準幀,并依次計算所述基準幀之后的視頻幀與所述基準幀之間的相似度;
若當前幀與所述基準幀之間的相似度小于或者等于指定閾值時,將所述當前幀確定為一個場景切換幀;
將所述當前幀作為新的基準幀,并依次計算所述新的基準幀之后的視頻幀與所述新的基準幀之間的相似度,并根據計算的所述相似度確定下一個場景切換幀。
4.根據權利要求1或2所述的方法,其特征在于,從視頻信息中識別特征詞匯的步驟包括:
將所述語音信息轉換為文字信息,并將轉換得到的所述文字信息和所述字幕信息、所述標題信息作為待識別的文本;
將所述待識別的文本拆分為多個詞匯,并將拆分得到的所述詞匯作為所述視頻信息中包含的特征詞匯;
識別所述圖像信息中包含的對象,并將表征所述對象的詞匯作為所述視頻信息中包含的特征詞匯。
5.根據權利要求4所述的方法,其特征在于,在將所述待識別的文本拆分為多個詞匯之后以及識別所述圖像信息中包含的對象之后,所述方法還包括:
分別計算拆分得到的所述詞匯的權重值以及表征所述對象的詞匯的權重值,并從拆分得到的所述詞匯以及表征所述對象的詞匯中篩選出權重值滿足指定關系的目標詞匯,并將所述目標詞匯作為所述視頻信息中包含的特征詞匯。
6.根據權利要求1所述的方法,其特征在于,在所述標簽庫中查詢與所述特征詞匯組中的特征詞匯相匹配的描述詞匯包括:
針對所述特征詞匯組中的當前特征詞匯,計算所述當前特征詞匯與所述標簽庫中描述詞匯之間的相似度;
將計算得到的最高相似度對應的描述詞匯作為所述當前特征詞匯在所述標簽庫中相匹配的描述詞匯。
7.根據權利要求1所述的方法,其特征在于,所述標簽庫中包括多個按照視頻的類型進行劃分的子標簽庫;
相應地,確定所述特征詞匯組中包含的描述詞匯組包括:
在所述標簽庫中識別與所述目標視頻的類型相適配的目標子標簽庫;
在所述目標子標簽庫中查詢與所述特征詞匯組中的特征詞匯相匹配的描述詞匯,并判斷查詢得到的所述描述詞匯中是否存在處于同一個目標描述詞匯組中的描述詞匯;
若存在,判斷查詢得到的所述描述詞匯中處于所述目標描述詞匯組中的描述詞匯的數量是否達到所述目標描述詞匯組中包含的描述詞匯的標準數量;
若達到,將所述目標描述詞匯組作為所述特征詞匯組中包含的描述詞匯組。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于阿里巴巴(中國)有限公司,未經阿里巴巴(中國)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810273066.6/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:內容推薦方法、內容推薦裝置和電子設備
- 下一篇:一種標簽補齊方法及裝置





